大数据面试题
大数据面试题
下列哪个程序通常与 NameNode 在一个节点启动?答案D
A)SecondaryNameNode
B)DataNode
C)TaskTracker
D)Jobtracker
解析:hadoop的集群是基于master/slave模式,namenode和jobtracker属于master,datanode和tasktracker属于slave,master只有一个,而slave有多个SecondaryNameNode内存需求和NameNode在一个数量级上,所以通常secondary NameNode(运行在单独的物理机器上)和NameNode运行在不同的机器上。
JobTracker和TaskTracker:JobTracker 对应于 NameNode;TaskTracker 对应于 DataNode;
DataNode 和NameNode 是针对数据存放来而言的;JobTracker和TaskTracker是对于MapReduce执行而言的。Mapreduce中几个主要概念,mapreduce整体上可以分为这么几条执行线索:Jobclient,JobTracker与TaskTracker。
磁盘通常是集群的最主要瓶颈。
解析:
1.cpu处理能力强 2.内存够大所以集群的瓶颈不可能是a和d 3.网络是一种稀缺资源,但是并不是瓶颈。 4.由于大数据面临海量数据,读写数据都需要io,然后还要冗余数据,hadoop一般备3份数据,所以IO就会打折扣。
关于 SecondaryNameNode 哪项是正确的?答案C
A)它是 NameNode 的热备
B)它对内存没有要求
C)它的目的是帮助 NameNode 合并编辑日志,减少 NameNode 启动时间
D)SecondaryNameNode 应与 NameNode 部署到一个节点。
解析:
上一篇: 算法之用后缀表达式求值
下一篇: Hadoop1.x了解