数据分析与数据挖掘的区别和联系?
数据分析与数据挖掘的界定非常的模糊。但有一点可以确定,数据分析输出的是统计结果,比如总计,平均值等,数据挖掘输出的是模型或规则,我们一起来看下之间区别:
二者有以下几点区别
1.对计算机编程能力的要求不同
一个对编程、敲代码一窍不通的人完全可以成为一名优秀的数据分析师。数据分析很多时候用到的都是诸如Excel、SPSS、SAS等成型的分析工具,这些工具已经可以满足大多数数据分析的要求。
而数据挖掘则需要一定的编程基础。在做数据仓库组建、分析系统开发、挖掘算法设计等工作时,常常需要工作人员亲力而为地从ETL开始处理原始数据,因此对计算机水平有较高要求,并且更偏技术方向。目前从事数据挖掘相关工作的人大多都隶属于计算机系。
2. 侧重于解决的问题不同
数据分析主要侧重点在于通过观察数据来对历史数据进行统计学上的分析;而数据挖掘则是通过从数据中发现“知识规则”来对未来的某些可能性做出预测,更注重数据间的内在联系。
3. 对专业知识的要求不同
一名数据分析师,必须要对所从事的行业有较深入的了解,并且需要将数据与自身的业务紧密地结合起来。当然,除了需要了解本行业之外,还应当懂得统计学、营销学、社会学、心理学、经济学等方面的知识。假若能对数据挖掘等相关知识有所了解会对工作更有帮助。
而想要成为优秀的数据挖掘工程师,则需要拥有良好的统计学知识、数学能力、编程能力,熟悉数据库技术、数据挖掘的各种算法,并且要能够根据不同的业务需求,建立相应的数据模型并将模型与实际相结合,甚至需要对已有的模型和算法进行优化或者开发新的算法模型。
相比而言,数据挖掘在广度上稍逊于数据分析,但在深度上,数据挖掘则更胜一筹。
二者的相似之处
不论是数据分析师还是数据挖掘师,数据都是他们赖以生存的重点,假若搜集不到数据或者没有足够的数据作为支持,那么将无法进行相应的工作。并且他们都需要掌握相关的统计学知识,并且对数据都需要有较高的敏感性。
虽说数据挖掘与数据分析有所不同,但是很多时候,数据分析师与数据挖掘师也会需要做对方的工作。做数据分析时需要用到数据挖掘的工具和模型;做数据挖掘项目时同样需要他们懂业务、懂数据,并且需要他们能够根据业务需要提出正确的数据挖掘需求和方案。因此二者在职业上并没有明显的界限。
下一篇: DataNode的流式接口讲解
推荐阅读
-
MySQL数据库存储过程和事务的区别讲解
-
基本数据类型和包装类的区别
-
jQuery对象与DOM对象的区别和联系
-
网站数据分析之二:了解网站页面的点击情况以及数据的筛选和细分(图文)
-
爱分析创始人兼CEO金建华:线下数据智能的产业赋能实践与趋势
-
精妙的SQL和SQL SERVER 与ACCESS、EXCEL的数据导入导出转换
-
精妙的SQL和SQL SERVER 与ACCESS、EXCEL的数据导入导出转换
-
Oracle中Union与Union All的区别(适用多个数据库)
-
Python Pandas DataFrame:查询数据or选择数据(selection)之loc,iloc,at,iat,ix的用法和区别
-
jQuery之DOM对象和jQuery对象的转换与区别分析