hadoop和spark的区别
程序员文章站
2022-03-22 13:36:04
hadoop是基于磁盘的,它的运算结果保存在磁盘当中;而spark的运算是基于内存的。因此spark的运算速度是 hadoop的100倍;即使在磁盘当中运算,spark也是hadoop的10倍左右,原因就是spark具有优秀的作业调度策略。 故spark的速度快与hadoop的两个原因: (1)sp ......
hadoop是基于磁盘的,它的运算结果保存在磁盘当中;而spark的运算是基于内存的。因此spark的运算速度是
hadoop的100倍;即使在磁盘当中运算,spark也是hadoop的10倍左右,原因就是spark具有优秀的作业调度策略。
故spark的速度快与hadoop的两个原因:
(1)spark是基于内存,hadoop基于磁盘:
在hadoop中HDFS用于数据的存储,MapReduce用于计算。 MapReduce:从磁盘中读取文件->把迭代结果存储到磁盘中->再从磁盘中读取文件->.................. Spark:从磁盘中读取文件->把迭代后的结果存储到内存当中->再从内存中读取数据->.................. Spark的计算速度是hadoop的100倍,即使再磁盘中操作数据也是hadoop的10倍。
(2)spark具有优秀的作业调度策略(使用了有向无环图,关于这部分会在RDD学习模块中介绍)。
上一篇: Perl ASCII 字符判断
下一篇: 洛谷 P1471 方差
推荐阅读
-
Oracle中视图和同义词的区别
-
javascript中apply、call和bind的使用区别
-
PHP 里面call_user_func和$class->$func()的区别
-
ThinkPHP快捷步骤D和M的区别
-
1000万级粉丝和几千粉丝的微信开发有多大的区别?
-
eip和其他的cms管理系统有什么区别
-
php学习之道:php中is_file和file_exist的区别,and判断目录is_dir
-
华为nova8和华为nova8Plus的区别哪个更值得入手
-
PHP中exec函数和shell_exec函数的区别,execshell_exec_PHP教程
-
mysql_connect localhost和127.0.0.1的区别(网络层阐述),