《hadoop权威指南第二版》读书疑问(1)
程序员文章站
2022-03-25 18:07:02
...
第二章数据流部分,其中有段描述如下:
最佳分片大小应该与块大小相同,因为它是确保可以存储在单个节点上的最大输入块大小。如果分片跨越两个数据块,那个对任何一个HDFS节点,基本上都不可能同时存储这两个数据块,因为分片中的部分数据需要通过网络传输到map任务节点。
本人刚刚开始学些hadoop,对红色高亮部分不甚了解,望高手指教。
问题补充:
一个节点是否只有一个map任务运行?