从月薪8K的分析师到月薪2W,只因我有了这份工具清单! 数据分析
投行人必须会用的数据处理工具,你知道几个?
当实习中的你,被老板安排找到腾讯某股东占公司注册资金的百分比数据。你却一脸蒙圈不知道从何搜集数据,硬着头皮通宵整理完的数据又不知道如何快速整合,怀着忐忑的心情把Excel发出去,结果却因数据不美观被老板怒骂退回。
因为对数据一无所知的你
被老板翻过几个白眼?
今天,数据君就来教你KO数据的三大妙招,刷新老板对你的认知
第一招:如何在3s内获取数据?
一、搜集数据渠道
1.券商研究报告渠道
哪里才能获得第一手投资研究报告?知名金融数据平台像投行人必备的Bloomberg(彭博)和Factset是最常见的获取数据的渠道。
Bloomberg
Bloomberg (彭博)是为大多数大型金融机构提供服务,用户通过“彭博专业服务”可以查阅和分析实时的金融市场数据以及进行金融交易。
彭博终端是一套让专业人士访问“彭博专业服务”(Bloomberg Professional Service)的计算机系统。
彭博终端基于客户—服务器架构建立,服务器是一个多处理器的Unix平台,终端用户使用的客户端是一个Windows程序。
FactSet
FactSet研究系统是一家金融数据和软件公司,为全球主要金融机构的分析员、证券管理员和投资银行家提供金融信息和分析软件。
FactSet核心的优势主要集中在公司的财务数据,这也是为什么它成为投行Anaylst必备技能之一的原因。
FactSet在投行中的使用频率是Daily basis,而且FactSet个性化的界面,强大的功能,Excel plugin 也不差。
2.各大上市公司报告渠道
一些*咨询公司如德勤、IBM、贝恩等都会发布annual report以及公司近况通常具有时效性,能系统地反映公司现状,从而辅助投资的策略判断。
3.上市公司公告渠道
主要包括美国SEC、香港披露易、中国巨潮咨询查询上市公司,对于高净值个体或大型投资有辅助分析作用。
4.投行网站渠道
主要包括IPO、junling(巨灵)等渠道,多为华尔街咨询、香港股票行情、金融建模及演示,可获取各大投行现下投资组合分析及行情。
5.银行业网站渠道
主要包括World Bank(世界银行)、Forst(福斯特) 等各大知名银行平台渠道,可获得实时银行咨询以及公告、数据的查找。
6.数据库渠道
主要包括IEEE Xplore、EBSCO等,包含宏观数据、金融、教育、行业数据等,并拥有完备的年度数据。
7.国外国家or经济体数据渠道
其中包括美国(提供了有关美国当前经济形势的描述和主要宏观经济变量数据)和经济合作与发展组织数据(提供了成员国的金融数据,但也包括一些总体数据,比如GDP、失业和通货膨胀等)。如Heston-Summers数据库、《当代商业纵览》等。
8.综合性数据渠道
各类财经、股票、经济类数据库,如产品价格指数(PPI)详细报告,国际股票市场数据库,联合国统计年鉴等等,提供宏观经济信息、行业(产业)发展报告、企业(公司)信息、产品市场分析,大量表格和统计数据,以及很多相关站点的链接,内容从收入、财富到贫困问题都有。
9.策略常用网站渠道
国内常用财政部、发改委等官方网站来了解*政策及实时咨询,分析当前社会及资本浮动情况;国外常用BEA、CBO等了解股票、财政等等详细数据和实时分析。
10.搜索引擎渠道
主要包括谷歌、BASE、sciseek等搜索引擎,多用于查找、搜索资源,能准确定位你想要的数据。
二、使用程序语言自动抓取网络数据
在数据获取领域中,最为被广泛使用的就是python语言,俗称爬虫。
通过爬虫加正则这种自动化的工具,能够耗很少的人工就可以将数据和信息采集并结构化,后续通过更多的分析工具完成许多有商业价值的分析并获取所谓的insight(将信息转化为知识和洞察)。
推荐使用网站:regex101.com
示例:爬取社交网络数据:Facebook
Facebook提供了API,可以提交关键字等信息爬取搜索结果中的每一条内容。
第二招:如何清理数据?
1.万能的Excel
Excel是迄今为止最简单最便捷的处理数据方式。下至四则运算,上至各类统计分析、矩阵运算及线性规划都可以搞定。但是想在投行借excel玩出花样,千万不要以为会了VLookup及一些快捷键就可以耀武扬威了,至少需要把矩阵乘法、向量乘法、Offset/ Cells/ Row/ Range等函数用到极致,这样大多数Financial Model会做得非常灵活,而且各种数据查询及匹配工作会达到部分SQL的处理水平。
2.进阶版Excel:VBA
VBA会让Office的能力提升一个档次,除了完成函数不能完成的一些任务,最有价值的是能够在Office的各套软件之间实现信息同步。
学习Excel VBA较为正规的图书是 John Green的 Excel 2007 VBA Programmer's Reference,中文版由Excel Home翻译为《Excel 2007 VBA参考大全》。这本书应至少阅读完前7章。阅读完前4章即可以尝试解决工作中遇到的问题了。
第三招:如何完美地呈现数据
当数据清理完毕后,如果你直接呈现给Boss,那就糟了!你知道美化前后的数据的差别有多大?
前者是一个落魄的流浪汉,后者成了一个精英,虽然还是同一个人,但明显视觉感受迥然不同。而且最重要的是美化后的表格能带来80%的沟通效力。
如何美化数据?数据可视化,了解一下,它主要是借助于图形化手段,清晰有效地传达与沟通信息。
数据可视化技术包含以下几个基本概念:
①数据空间:是由n维属性和m个元素组成的数据集所构成的多维信息空间;
②数据开发:是指利用一定的算法和工具对数据进行定量的推演和计算;
③数据分析:指对多维数据进行切片、块、旋转等动作剖析数据,从而能多角度多侧面观察数据;
④数据可视化:是指将大型数据集中的数据以图形图像形式表示,并利用数据分析和开发工具发现其中未知信息的处理过程。
数据可视化主要用于以下两方面:
①报表类,如JReport,Excel,FineReport,ActiveReports报表等。
②BI分析工具,如Style Intelligence、BO,BIEE,帆软FineBI等。
③国内的数据可视化工具,有BDP商业数据平台-个人版,大数据魔镜,数据观,FineBI商业智能软件等。
1.Excel
Excel的图形功能并不强大,但Excel是分析数据的理想工具。
作为入门级工具,Excel是快速分析数据的理想工具,也能创建供内部使用的数据图,但是Excel在颜色、线条和样式上可选择的范围有限,这也意味着用Excel很难制作出能符合专业出版物和网站需要的数据图。
但是作为一个高效的内部沟通工具,Excel应当是你百宝箱中必备的工具之一。
2.Chart.js
JsChart组件功能强大,能适应各种复杂的需求和业务,而且操作起来相对简单。
3.Google Chart API
Google Chart API工具中取消了静态图片功能,目前只提供动态图表工具。但Google Chart的一个大问题是:图表在客户端生成,这意味着那些不支持JavaScript的设备将无法使用,此外也无法离线使用。
当然,Google chart API还是很强大的,在线自动帮你将所需要的数据汇总成,各式各样的图标,折线 饼状 柱状 气泡等等。
4.Echarts
Echarts是一款开源、功能强大的数据可视化产品。可以流畅的运行在 PC 和移动设备上,兼容当前绝大部分浏览器(IE8/9/10/11,Chrome,Firefox,Safari等),底层依赖轻量级的矢量图形库 ZRender,提供直观,交互丰富,可高度个性化定制的数据可视化图表。
5.D3
D3(Data Driven Documents)是支持SVG渲染的另一种JavaScript库。但是D3能够提供大量线形图和条形图之外的复杂图表样式,例如Voronoi图、树形图、圆形集群和单词云等。D3想要入门不是太简单,至少都要有HTML和JavaScript基础才行,对JavaScript的DOM要求也有点高。
6.Crossfilter
Crossfilter 是一个 JavaScript 类库,能够在浏览器端对大量数据进行多维分析。Crossfilter既是图表,又是互动图形用户界面的小程序,当你调整一个图表中的输入范围时,其他关联图表的数据也会随之改变。它可以在不同的 Group By 查询之间实现“交叉过滤”,自动连接和更新查询结果。
7.R语言
R语言是主要用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个*、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。它可以运行于UNIX,Windows和Macintosh的操作系统上,而且嵌入了一个非常方便实用的帮助系统。
8.jsDraw2DX
用于创建任何类型的交互式图形 SVG (旧 IE 浏览器是 VML ) 的一个独立 JavaScript 库。除了生成所有基本形状像线、 矩形、 多边形、 圆、 椭圆、 圆弧等,库包可以绘制曲线、 贝塞尔曲线 (任何 degree )、 函数图形、 图像和文本的装饰。
9.Visual.ly
如果你需要制作一个快速的视觉图像,你没有必要再询问专业的设计团队,你可以自己完成这些工作。Visual.ly就是最流行的一个选择。其中提供了大量信息图模板。
查找数据、处理数据、美化数据的工具都在这了
你平时用过哪几种呢?
学会其中一两种
分分钟KO各种数据
还怕不能升值加薪?