怎样培养数据分析能力 数据分析数据可视化
一般而言,数据分析需要哪些能力?
-
基本的理论知识:数理统计、模型原理、市场研究等。
-
常规分析工具的使用。常用办公软件(Excel、PPT、思维导图)、数据库、统计分析工具、数据挖掘等。
-
一定的业务理解能力,能理解业务背后的商业逻辑。只有理解问题,才能转换成数据分析的问题,才知道如何设定分析目标进行分析。
-
数据报告和数据可视化的能力。数据分析得再好,如果不能以漂亮的方式“表达”,成效也会大打折扣。
如果学习建议从分析理论和工具实践着手
分析理论
-
明确业务场景
-
确定分析目标
-
构建分析体系
-
梳理核心指标
首先明确是什么业务场景,因为业务不同,分析体系也不同。然后结合业务问题确定分析的目标,列出核心指标,整理所需要的数据。
推荐书籍:数据化管理:洞悉零售及电子商务运营 (豆瓣)、决战大数据 (豆瓣)
分解:从数据分析的几个步骤来看
-
数据获取
-
数据处理
-
数据分析
-
数据呈现
1、数据获取
数据获取看似简单,但是需要把握对问题的商业理解,转化成数据问题来解决,直白点讲就是需要哪些数据,从哪些角度来分析,界定问题后,再进行数据采集。此环节,需要数据分析师具备结构化的逻辑思维。
推荐书籍:《金字塔原理》、麦肯锡三部曲:麦肯锡意识、工具、方法;
推荐工具:思维导图工具(Xmind\百度脑图等);
2、数据处理
数据的处理需要掌握有效率的工具:
-
Excel及高端技能:基本操作、函数公式、数据透视表、VBA程序开发。按照我习惯的方法,先过一遍基础,知道什么是什么,然后找几个case练习。多逛逛excelhome论坛,平常多思考如何用excel来解决问题,善用插件,还有记得保存。
-
专业的报表工具(成规模的企业会用)日常做报表设计一个模板可通用,只要会写SQL就可上手。相比excel做报表,开发的技术要求较少,能很快地开发常规报表、动态报表。
-
数据库的使用:熟练掌握SQL语言(很重要),常见的有Oracle、SQL sever、My SQL等。学习流行的hadoop之类的分布式数据库来提升个人能力,对求职有帮助。
3、分析数据
分析数据往往需要各类统计分析模型,如关联规则、聚类、分类、预测模型等等。
因此,熟练掌握一些统计分析工具不可免:
-
lPSS系列:老牌的统计分析软件,SPSS Statistics(偏统计功能、市场研究)、SPSS Modeler(偏数据挖掘),不用编程,易学。
-
SAS:经典挖掘软件,需要编程。
-
R:开源软件,新流行,对非结构化数据处理效率上更高,需编程。
-
各类BI工具:Tableau、PowerBI、FineBI,对于处理好的数据可作*的可视化分析,图表效果惊人。
推荐书籍:
《说菜鸟不会数据分析》系列,入门级书,初学者最适。
《数据挖掘与数据化运营实战,思路、方法、技巧与应用》,内容很系统很全面。
《市场研究定量分析方法与应用》,简明等编著,中国人民大学出版社。
4、数据可视化呈现
很多数据分析工具已经涵盖了数据可视化部分,只需要把数据结果进行有效的呈现和演讲汇报,可用word\PPT\H5等方式展现。
对于入门小白,建议从excel工具入手
学习excel也是一个循序渐进的过程
-
基础的:简单的表格数据处理、打印、查询、筛选、排序
-
函数和公式:常用函数、高级数据计算、数组公式、多维引用、function
-
可视化图表:图形图示展示、高级图表、图表插件
-
数据透视表、VBA程序开发
按照我习惯的方法,先过一遍基础,知道什么是什么,然后找几个case练习。多逛逛excelhome论坛,平常多思考如何用excel来解决问题,善用插件,还有记得保存。
函数和数据透视表是两个重点:
制作数据模板必须掌握的excel函数
-
日期函数:day,month,year,date,today,weekday,weeknum。日期函数是做分析模板的必备,可以用日期函数来控制数据的展示,查询指定时间段的数据。
-
数学函数:product,rand,randbetween,round,sum,sumif,sumifs,sumproduct
-
统计函数:large,small,max,min,median,mode,rank,count,countif,countifs,average,averageif,averageifs。统计函数在数据分析中具有举足轻重的作用,求平均值,最大值,中位数,众位数都用得到。
-
查找和引用函数:choose,match,index,indirect,column,row,vlookup,hlookup,lookup,offset,getpivotdata。这几个函数的作用不用多说,特别是vlookup,不会这个函数基本上复杂报表寸步难行。
-
文本函数:find,search,text,value,concatenate,left,right,mid,len。这几个函数多半用在数据整理阶段使用。
-
逻辑函数:and,or,false,true,if,iferror
(以上学会,基本能秒杀90%的办公室白领。)
数据透视表
数据透视表的作用是把大量数据生成可交互的报表,数据透视表具有这样一些重要功能:分类汇总、取平均、最大最小值、自动排序、自动筛选、自动分组;可分析占比、同比、环比、定比、自定义公式。
对于浸淫多年的表哥表姐
现实中,取数或报表+EXCEL+PPT似乎还是主流形式。
工具上,无论是业务人员还是分析人员,都可以通过自动取数工具或者BI工具来制作报表,减少重复操作的时间。
其次,增加与业务人员的沟通,充分了解并挖掘需求,当你的业务水平和他们差不多甚至更高时,自然而然知道真实的需求是什么了。
最后,站在更高角度上,报表的基本粒度就是指标,可梳理出企业的基本指标体系,从经营分析的角度去做报表,把报表的工作标准化,降低报表的冗余,避免动不动就做一张报表。标准化包括指标分类,指标命名,业务口径,技术口径,实现方式等等。其实,最终目的是实现报表数据一致性,减少重复报表开发,降低系统开销的战略性举措。
业余时间可以拓展自己的知识面,往上下游发展,补充数理统计知识,学习R、Python语言,都是提升自己的很好方式。
上一篇: MySQL优化之 定位性能问题
下一篇: 在PHP中使用redis