数据分析基础如何自学(解读数据分析基础知识点)
从我的数据分析课程开讲以来,收到了不少朋友的问题:我是做运营的想入门数据分析应该怎么学?新手做数据分析有哪些好用的工具?会用excel但是做分析总是没思路怎么办?做数据分析有哪些方法……等等一系列的问题,今天我就用这篇文章统一回答关于数据分析入门的问题
数据分析是什么?
很多人都没有搞懂数据分析是什么,包括一些公司和企业也没搞清楚数据分析的定义。经常听到有人说投了数据分析的岗位,结果入职之后每天干的活就是取数给业务用,感觉自己就像个取数机。这样的工作根本不能叫做数据分析。
什么是数据分析,用我自己的话来说就是针对某个问题,将获取后的数据用分析手段加以处理,并发现业务价值的过程。这一句话也基本涵盖了数据分析的流程:目标确定——数据获取、清洗、整理——数据分析——结果呈现
数据分析需要哪些能力
数据分析师需要会哪些技能,围绕上面数据分析的基本流程,我把数据分析师的能力分为这样三大部分:基础知识、工具技能、分析方法与思维,以下师数据分析的技能大纲,图中标记了能力等级,大家根据自己的情况对应学习:
数据分析基础知识
数据分析理论知识这方面,需要掌握是统计学和机器学习相关知识。
1、统计学
毫不夸张的说统计学是整个数据分析的灵魂。判别一个数据分析师强弱的一个重要方法就是,看他对统计规律的敏感度。这里我们需要从基础的统计理论(描述性统计、区间估计、假设检验等)出发,到基本的统计分析(t 检验、方差分析等),最后到商业常用的模型(回归分析、方差分析等),学习数据分析背后的逻辑,掌握实用统计学的概念和会利用统计的思维去思考问题。
推荐书籍:《深入浅出数据分析》、《统计学习方法》李航
《深入浅出数据分析》这本书非常推荐作为小白的入门书籍,特别是之前没有接触过数据分析的。特点和书名一样深入浅出,而且图多。里面没有那么多公式和理论,但其中对于统计的基本原理以及统计问题的来源场景介绍的非常通透,非常符合深入浅出系列定位。如果有之前有一定基础,建议略过。
2、机器学习
对于想要进阶成为高级数据分析师的朋友来说,就要掌握机器学习相关的知识:
特征工程的基础:如何统计数据特征、选用不同的特征,做模型的优化;
基本的分类算法:决策树、随机森林等;
基本的聚类算法、数据挖掘、常见的机器学习算法的了解等等
机器学习相关的知识学习成本会比较高,对某些同学来说可能会有一定难度,但对于业务型数据分析师来说,一般不会要求你去推导算法公式,能做到明白不同算法的适用场景、优缺点、原理大概懂就基本可以了。
推荐学习书籍:《机器学习》周志华,网上也有不少学习视频,入门的话我推荐吴恩达的coursera机器学习课,
数据分析工具学习
1、ppt
为什么把ppt放在第一,原因很简单,我们做数据分析的目的是什么?当然是为了展示给客户、上级,供他们做决策。所以ppt作为主流汇报、展示工具,是将分析关键结果传递给其他的重要手段。学好ppt可以提升沟通和消息传递效率,也是数据分析师必备的技能,具体学习书目我就不做推荐了。
2、excel
excel应该是数据分析师最常用的统计分析工具了,原因是因为方便,所见即所得,而且具有方便的可视化功能。应该说只有学会了vlookup,数据透视和基本公式才算excel入门,其次excel最大的惊喜是数据可视化,拥有大量的图表模板,可以减轻我们很多工作。
这里我推荐《谁说菜鸟不会数据分析》这本书作为excel入门。这本书如果作为数据分析入门书籍是不合格的,因为它有太多内容是关于excel基本操作的,关于数据分析的内容反而很少,但是实事求是的讲这本书里面关于excel数据分析常用公式、数据可视化的内容还是不错的,可以当成一本入门书籍。
3、access
为什么把access作为中级数据分析师必备技能,原因很简单,当数据太大,excel又处理不了,又没有很强的编程基础怎么办?access的优势就体现出来了,它可以在不用掌握很高深编程语言的条件下,处理excel所不能承载的大存储量的数据原始文件,速度奇快,且易学易用。
作为入门,我推荐《表哥的access入门》这本书。通过一个简单的小饭馆数据库管理程序的开发过程,对理解数据库和学习一些基本的access很有帮助。
4、sql
作为数据分析人员,要想获取数据,肯定就要和数据库打交道,因此sql肯定是要掌握的,在招聘要求中,sql也是很多数据分析岗位的能力要求之一。学习sql最快的方法是能自己下载数据库管理工具,找些数据练习,主要了解一些数据库查询语言,where,group by,orderby,having,like,count,sum,min,max,distinct,if,join,left join,limit,and和or的逻辑,时间转换函数等。
推荐书籍:《mysql必知必会》
5、python
python作为目前最火的编程软件之一,确实在数据分析、数据挖掘上有着独特优势。是否具备编程能力,也是初级数据分析和高级数据分析的分水岭。以下以python的学习路线图:
看起来要学习的内容挺多的,但其实python最大的优势就是语言简约,非常易于读写,如果之前有一定的编程基础,上手很快。推荐书籍《python编程快速上手》,新手可以跟着书里的内容一步步做,把里面的项目做完,差不多就入门了
6、商业数据分析软件
excel做数据分析难以解决大数据量的问题,对没有编程基础的人来说上手python又比较难,这时候可以选择利用数据分析软件来做数据分析,现在市场上的数据分析软件基本都涵盖来数据采集、处理、分析到可视化展现的过程,操作简单,可视化效果很棒,比较适合新手入门。比较好用的有finebi、tableau 等等
数据分析方法
学习数据分析肯定有人上网百度了不少数据分析方法,什么漏斗分析法,pest,swot模型、杜邦分析法等等。并且由于不同版本的演绎,造成了分析方法种类繁多,令人眼花缭乱,关于分析方法值得一说的就是一定要结合行业特点,特别是对业务的掌握,这样才能事半功倍。下面简单列几个比较通用的分析方法:
1、对比分析法
对比分析法常用的基础分析方法,虽然方法特别简单,但几乎所有的分析报告中,都会采取对比分析方法。比如去年同期相比、上个月环比、目标和实际达成相比、各个部门和业务线相比、行业内竞品比较、营销效果对比,等等。这里需要注意的是我们不管是横向比较还是纵向比较,比较的双方一定要有可比性,并且在同一个维度、粒度上去比较,要不是毫无意义的。
2、5w2h分析法
这个方法主要应用于用户行为研究和专项问题分析,从时间、地点、人物、事情、原因、方式、价格等7个方面对一个问题进行刻画研究。
3、swot
明确资源优势(strengths)、竞争劣势(weaknesses)、外部环境变化带来的机会(opportunities)和威胁(threats)等,将这些因素有机结合起来,以此确定企业经营战略。
4、pest
从政治(politics)、经济(economics)、社会(society)、技术(technology)4个视角分析外部环境。
5、杜邦分析法
杜邦分析法是一种用来评价公司盈利能力和股东权益回报水平,从财务角度评价企业绩效的一种经典方法。其基本思想是将企业净资产收益率逐级分解为多项财务比率乘积,这样有助于深入分析比较企业经营业绩。
数据分析思维
分析思维是数据分析师最最核心的竞争力,上面所学习的python、sql、机器学习知识等都是在工具层面,要想使用好他们,还需要分析思维的驾驭。对于分析思维的学习,我建议新人也是从读书开始,我看过的且比较推荐的书包括:
- 数据分析类
《精益数据分析》、《增长黑客》、《数据化管理:洞悉零售及电子商务运营》、《数据挖掘与数据化运营实战 思路、方法、技巧与应用》
- 产品思维类,如果是想要从事互联网行业的数据分析师的话,产品思维也是必须要具备的,面试考察点之一
《从点子到产品:产品经理的价值观与方法论》、《俞军产品方法论》、《产品思维》
- 逻辑思维类:在面试中逻辑清晰的回答面试官的问题,会为你大大的加分
《金字塔原理》、《学会提问》、《麦肯锡思维》