下列关于HDFS为存储MapReduce并行切分和处理的数据做的设计,错误的是()
A. . FSDatalnputStream扩展了DatalnputStream以支持随机读
B. .为实现细粒度并行,输入分片(Input Split)应该越小越好
C. .—台机器可能被指派从输入文件的任意位置开始处理一个分片 D.输入分片是一种记录的逻辑划分,而HDFS数据块是对输入数据的物理分 割
查看答案
针对每行数据内容为"Timestamp Url”的数据文件,在用JobConf对象 conf设置conf.setInputFormat(WhichInputFormat.class)来读取这个文件时,WhichInputFormat应该为以下的( ) A . TextInputFormat
A. KeyValueTextInputFormat
B. SequenceFileInputFormat D . NLinelnputFormat
在高阶数据处理中,往往无法把整个流程写在单个MapReduce 作业中,下 列关于链接MapReduce 作业的说法,不正确的是()
A. . Job 和JobControl类可以管理非线性作业之间的依赖
B. . ChainMapper和 ChainReducer类可以用来简化数据预处理和后处理的构成 c.使用ChainReducer时,每个mapper 和 reducer对象都有一个本地JobConf 对象
C. . ChainReducer.addMapper()方法中,一般对键/值对发送设置成值传递,性能 好且安全性高
HBase分布式模式最好需要()个节点? A1
A. 2
B. 3
C. 最少
配置Hadoop 时,JAVA_HOME包含在哪一个配置文件中()
A. . hadoop-default.xml
B. .hadoop-env.sh
C. . hadoop-site.xml D. configuration.xsl