大数据为大家整理了ofer mendelevitch自己的观点。
mendelevitch认为无论是java程序员还是业务分析师都有机会成为数据科学家,以下是他对不同人群给出的具体建议:
java程序员
作为java开发者,你对软件工程的规则已经了然于心,第一步需要了解机器学习的各种算法:现在有哪些算法,都能解决哪些问题以及如何实现。另外还需要学习使用r和matlab等建模工具,此外weka、vowpal wabbit和opennlp等库也为大多数常见算法提供了经过验证的实现方法。
如果你还不太熟悉hadoop,也可以选择加米谷大数据带你入行!
很多初学者,对大数据的概念都是模糊不清的,大数据是什么,能做什么,学的时候,该按照什么线路去学习,学完往哪方面发展,想深入了解,推荐一个大数据学习群 142974151每天晚上20:10都有一节【免费的】大数据直播课程,专注大数据分析方法,大数据编程,大数据仓库,大数据案例,人工智能,数据挖掘都是纯干货分享,给大家分享目前国内最完整的大数据高端实战实用学习流程体系。
python程序员
如果你是python程序员,对软件开发和脚本编写一定很熟悉,也许已经在使用很多数据科学中常见的库例如numpy和scipy。
python对数据科学应用的支持很好,尤其是numpy/scipy, pandas, scikit-learn, ipython等用于探索性分析的库,在处理大型数据集方面,多学些hadoop及其与python的流式集成。
统计学从业者
如果你有统计学或者机器学习的背景,对于r、matlab和sas等工具一定非常熟悉,对于很多机器学习算法都有很成熟的实现方法。但是,这些工具通常被用于做数据勘探和模型开发,很少单独用来开发产品级的数据产品。显然,熟悉一门现代编程语言,例如java是你的首要任务。
业务分析师
如果你的背景是sql,那么说明你已经跟数据打交道很多年了,你很清楚如何通过数据获取业务分析结果。hive能让你以你熟悉的sql语言访问hadoop上的大数据集,因此是你步入大数据殿堂的首选。
总结
通向大数据之路不可能一帆风顺,你必须学习很多新规则和最少一门编程语言,更重要的是还要积累实战经验)。这些都需要时间、精力以及金钱投入,但最终你会发现一切都物超所值