什么是数据挖掘?

大公司对你的了解比你想象的更多 - 这就是如何

数据挖掘是分析大量数据以发现模式和知识。 事实上,数据挖掘也被称为数据发现或知识发现。

数据挖掘使用统计学,机器学习(ML)原理, 人工智能 (AI)和大量数据(通常来自数据库或数据集)以尽可能自动化和有用的方式识别模式。

数据挖掘做什么?

数据挖掘有两个主要目标:描述和预测。 首先,数据挖掘描述了从分析数据模式中获得的见解和知识。 其次,数据挖掘使用已识别数据模式的描述来预测未来模式。

例如,如果您花时间在购物网站上浏览关于如何识别不同类型工厂的书籍,那么在该网站幕后工作的数据挖掘服务会记录与您的配置文件有关的搜索的描述。 当您两周后再次登录时,网站的数据挖掘服务会使用您之前搜索的描述来预测您当前的兴趣,并提供个性化购物建议,其中包括关于识别植物的书籍。

数据挖掘如何工作

数据挖掘使用算法,告诉计算机或过程如何执行任务的指令集,来发现数据中的不同类型的模式。 数据挖掘中使用的一些不同模式识别方法包括聚类分析,异常检测,关联学习,数据依赖性,决策树,回归模型,分类,异常值检测和神经网络。

虽然数据挖掘可用于描述和预测所有不同类型数据的模式,但即使他们没有意识到,许多人最常遇到的用法是描述购买选择和行为中的模式,以预测未来购买的可能性决定。

举个例子,你有没有想过Facebook总是怎么知道你在网上看到的东西,并在你的新闻推送中显示与你访问过的其他网站或你的网页搜索相关的广告? Facebook数据挖掘使用存储在您的浏览器中的信息来跟踪您的活动(如Cookie) ,并根据您以前使用Facebook服务发现和预测您可能感兴趣的产品或产品,

什么样的数据可以被挖掘?

根据服务或商店(实体商店也使用数据挖掘),可以挖掘出令人惊讶的关于您和您的模式的数据。 收集到的关于您的数据可能包括您开车的类型,您居住的地点,您去过的地方,您订阅的杂志和报纸以及您是否已婚。 它还可以决定你是否有孩子,你的爱好是什么,你喜欢哪个乐队,你的政治倾向,你在网上购买什么,在实体店购买什么(通常通过顾客忠诚奖励卡)以及你分享的任何细节关于你在社交媒体上的生活。

例如,针对青少年的零售商和时尚型出版物使用来自Instagram和Facebook等社交媒体服务上的数据挖掘照片的洞察力,预测可吸引青少年购物者或读者的时尚趋势。 通过数据挖掘发现的见解可以非常精确,以至于一些零售商甚至可以根据她的购买选择中的特定变化来预测女性是否可能怀孕。 据报道,零售商Target根据购买历史中的模式预测怀孕非常准确,它将婴儿用品的优惠券寄给一位年轻女士,在她告诉她的家人之前将她的怀孕秘密送出。

数据挖掘无处不在,然而,我们发现并分析了有关我们的购买习惯,个人偏好,选择,财务和在线活动的大部分信息,这些信息被商店和服务部门用来提高客户体验。