判断:MapReduce设计的一个理念就是“计算向数据靠拢”,而不是“数据向计算靠拢”,因为,移动数据需要大量的网络传输开销。()
查看答案
判断:两个键值对和,如果对其进行归并(),会得到,如果对其进行合并(),会得到> ()
A. 错误
B. 正确
RDD操作分为转换()和动作()两种类型,下列属于动作()类型的操作的是()
A. map
B. filter
C. groupBy
D. count
下列关于常见的动作()和转换()操作的API解释错误的是()
A. count():返回数据集中的元素个数
B. filter(func):筛选出满足函数func的元素,并返回一个新的数据集
C. take(n):返回数据集中的第n个元素
D. map(func):将每个元素传递到函数func中,并将结果返回为一个新的数据集
分布式文件系统HDFS采用了主从结构模型,由计算机集群中的多个节点构成的,这些节点分为两类,一类存储元数据,另一类存储具体数据,它们分别是()
A. 名称节点,数据节点
B. 数据节点,名称节点
C. 名称节点,主节点
D. 从节点,主节点