欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  数据库

读书笔记 Big Data Analytics with R and Hadoop

程序员文章站 2022-06-08 18:12:13
...

RHadoop实践系列文章,包含了R语言与Hadoop结合进行海量数据分析。Hadoop主要用来存储海量数据,R语言完成MapReduce 算法,用来替代Java的MapReduce实现。有了RHadoop可以让广大的R语言爱好者,有更强大的工具处理大数据1G, 10G, 100G, TB, PB。 由于大数据

RHadoop实践系列文章,包含了R语言与Hadoop结合进行海量数据分析。Hadoop主要用来存储海量数据,R语言完成MapReduce 算法,用来替代Java的MapReduce实现。有了RHadoop可以让广大的R语言爱好者,有更强大的工具处理大数据1G, 10G, 100G, TB, PB。 由于大数据所带来的单机性能问题,可能会一去不复返了。 RHadoop实践是一套系列文章,主要包括”Hadoop环境搭建”,”RHadoop安装与使用”,”R实现MapReduce的协同过滤算法”,”HBase和rhbase的安装与使用”。对于单独的R语言爱好者,Java爱好者,或者Hadoop爱好者来说,同时具备三种语言知识并不容 易。此文虽为入门文章,但R,Java,Hadoop基础知识还是需要大家提前掌握。 关于作者 张丹(Conan), 程序员Java,R,PHP,Javascript weibo:@Conan_Z blog:?http://blog.fens.me email: bsspirit@gmail.com 转载请注明出处: http://blog.fens.me/r-hadoop-book-big-data/ 前言 最近的一本新书Big Data Analytics with R and Hadoop是关于R和Hadoop实践的第一本图书,作者Vignesh Prajapati曾经在图书出版的半年前联系过我,通过Google翻译发现了我的博客,希望把其中的1-2个例子放到他的书中。 没想到这本书,经过半年就出版了,作者效率还是挺高的。受Packt Publishing编辑Amol Bhosle委托为本书写个书评,于是就有本篇文章。 目录 图书概览 图书内容剖析 最后总结 1. 图书概览 本书的几个核心点:R,Hadoop, R+Hadoop, 数据分析案例,机器学习算法案例,R的数据访问接口。 我通过一个思维导图来表达。 书中最重要的是案例部分,作者分别使用R语言单机实现,以及RHadoop的分步式实现,介绍是多个案例的实践。 2. 图书内容剖析 R语言介绍 Hadoop介绍 R+Hadoop技术方案 数据分析案例 大数据分析案例 R语言的数据访问接口 1). R语言介绍 简单地介绍了R安装,RStudio安装,R语言最擅长算法模型:回归,分类,聚类,推荐。 2). Hadoop介绍 主要是介绍了Hadoop安装,在几种不同的Linux系统上,用Apache …
Read more