欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  后端开发

用R语言的公司多吗?

程序员文章站 2022-05-24 14:31:07
...
用R语言的公司多吗?用R做数据分析或者数据挖掘的。本科生,想自学,R和Python都学了一点点。本科统计学。R用起来顺手点..没其他编程基础...想知道市场人才需求方向。初次提问...希望有人给点解答啦!谢谢

回复内容:

也说虚一点的话,生物界用R的很多,互联网的话,貌似python比R火一点,因为python比R应用范围广,而且互联网界码农较多,搞统计的较少……
来点实在一点的,你可以用R或者PYTHON自己去写一个爬虫,去爬一下如拉勾网-最专业的互联网招聘平台,NLPJob或者英才网乃至国外的一些知名招聘网站,看看里面1000个岗位,要R的有多少,要python的有多少,既锻炼技术,又能直观了解行情,还玩一下你的技术,我之前刚玩爬虫的时候,首先爬的就是招聘网站信息罒__罒
爬虫,R指路rvest+rcurl 之前在艾瑞咨询实习的时候,我的leader(职位是高级数据挖掘工程师)跟我说,现在在企业中,R主要是用来做可视化(ggplot2确实强大),做建模分析主要是用Python,数据预处理主要是用SQL。他解释到:R跑的慢,而且对于算法的优化很有限(因为已经封装好了)。用Python做建模分析,主要是从底层编写算法,这样可以针对具体的问题,对算法进行优化。再加上Python相对R而言跑得更快,所以Python在建模方面更有优势。 上面的回复多数是从数据分析的角度评论R,我想从数据分析之后的角度comment一下:
我们数据分析之后需要将分析出来的结果做成报告( 或者是模型,仪表盘等), R做报告的时候可以用R markdown,python可以用IPython。如果是做模型或者仪表盘的话,虽然R也有很多包可以完成这个任务,但是你会发现python会有更多resource可以融合,使用更灵活,而R里的各种包里function是固定好的,相对更依赖制作package的作者。总的来说,用R做数据分析和报告都很便捷,需要熟练掌握,在这个基础上尽力学好python。这样的话在以后做任何数据产品的时候将会更得心应手。 尝试回答一下,和大家探讨。

互联网行业计算机出身的人比较多,团队里程序员同事一般会在数据分析师的周围,一些数据需求也会由这些程序员导出。由于计算机专业的人偏好Python,所以Python在数据导出这部分占了很大的比重。当然前提是SQL熟悉的情况下,使用Python结合SQL写脚本导出数据。Python功能太强大,就不一一说明了,下面说说R比较厉害可用的地方。

R主要是统计出身的人喜欢用,但是在互联网公司,这个真的是小众,技术规定也不希望团队使用,个人使用就没问题。R在数据分析师平时的工作中,主要是统计建模,和可视化处理。由于rmarkdown能写作自动报告,因此很适合用作自动化报表的开发,结合Linux环境crontab调度,可以很好地实现自动报表的功能。

扩展来说,R自动报表和可视化的能力,也很适合搭建在线模型监测系统和AB测试模型系统。比如说每天会在服务器里跑一个统计模型,每日更新交易数据后,第二天调度更新模型。作为统计系出身的你,应该很清楚每个模型都需要做完备的假设检验,而这部分最好同时结合可视化的报告与检验的值去观察下结论。这时候,由于自动分析报告已经就绪,你完全可以花几分钟观察一下,再决定是否去调整某些参数。这里的每日,可以频繁到每小时甚至更短。当然,报告每天发一次估计就足够了。

AB测试其实也主要是利用了自动报表,每天自动分析测试结果。结合模型方法,会有相当好的监测效果。更加统计的方面,是对测试用户的均匀抽样,这个抽样是否均匀,也是可以可视化报告展现的。对应不同的测试要求,抽样频次同样可以不同。真实情况中,测试抽样用户集的情况,直接影响是否正确实验的成败,我认为是非常非常重要的。不然,AB测试的结果不会可靠。 先说点虚的,R语言从世界编译语言排行44上升到12名;
然后,以我目前了解,无论是电子商务、通信、金融都有很多实用R,因为它的开源性以及众多包和接口,使得很多人都在实用。
最后,前几天看到一些JD,上面写着实用R语言18个月,薪资15-25K。 用R做数据分析和数据挖掘的电子商务公司还是比较多的,比如阿里、京东、1号店等,分析团队中部分同事会使用R作为分析工具。
分析挖掘工具有很多,R是其中之一。

R语言环境很好搭建,只要一台内存较大的Linux服务器就行,在上面安装 RStudio Server(支持多人通过浏览器界面登录使用),并且使得该环境与数据库服务器通信即可(可读可写)。
基本流程是,从数据库载入数据到R环境,分析/挖掘在R中完成,并且可将结果回写到数据库中。

这是针对数据分析和挖掘挖掘而言。

不过,用R来做报表和报告是不合适的,用来作为抓取数据的程序也是不合适的,这些都是开发工作,请交给程序员来完成(数据分析师可以作为产品设计师/数据产品经理提出需求)。
R,是统计分析的语言,是“分析”工具,不是“开发”工具! 正好在一家互联网公司用R做数据分析,就来回答一下吧。
之前一直用R+SQL+excel来做数据分析,一些涉及到统计模型的东西用R做确实很方便,用SQL做初步过滤,用R做数据清洗和预处理,再用R边探索数据边建模,模型跑完后结果再写回到数据库里。模型测试成熟后可以用python或者R写脚本,做成自动化分析,看个人喜好。
但是后来部门调整后,需要接触hadoop平台上的其他业务数据,(没错就是大数据>_至于中小量的数据处理和分析,个人觉得,用R或python都可以。因为都是加载在单机内存中运算的,只要内存吃得消,都能算。但是python作为一门编程语言确实和其他语言平台结合地更好一些。
互联网行业行业本身的行业风格是偏向*灵活化,只要能分析出合理需要的结果,是不太在意你用R用python用SAS的(SAS可能会在意,毕竟是需要花钱购买的,成本在那里)。
金融行业呢,不太了解,据说还是SAS,也见到过需要R的。
以上 python+R+SQL/NoSQL,数据分析师的标配吧 私募基金做统计套利会用,用得很广泛。我老师是一家私募基金的合伙人,他用R很多年了。
但一些咨询公司还是用商用的SAS,按实习老板的话说因为R是免费的,他们觉得不太放心, 所以做项目还是得用商用的SAS。
另外一个统计公司的朋友说他们都用SPSS,理由是完整版的SPSS很强大,只是我没见过而已。R太学院派,数据处理能力比不上商用软件。
我的观点是会R肯定是加分项。基金公司和证券公司的量化团队基本都认。 R vs python 各有长短,学起来了,很多两者通用。
相关标签: Python