给定一个巨大的文本(如1TB),可以编写mapreduce程序计算单词出现的数目,需要经历如下哪几个步骤()
A. 自动对文本进行分割
B. 对分割后的每一个KV对应用用户定义的Map进行处理,生成新的KV对
C. 对输出的结果集归拢、排序(系统自动完成)
D. 通过Reduce操作生成最后结果
查看答案
20Newsgroups数据集是机器学习研究中常用的标准数据集,它使用20个Usenet新闻单位上几个月发布的18828个消息,共18828个文件,如果要对该数据集使用mahout进行文本分类,错误的做法是()
A. 直接使用mahout算法,在namenode机器的本地文件系统中调用这18828个文件
B. 将这18828个文件上传到hdfs上,然后使用mahout算法分析
C. 使用mahoutᨀ供的seqdirectory命令将18828个文件序列化成一个大文件上传到hdfs上,然后使用mahout算法分析
D. 将这18828个文件rar压缩软件将其压缩成一个大文件上传到hdfs上,然后使用mahout算法分析
使用4G网络需满足的条件有哪些?()
A. 使用支持4G网络的USIM卡
B. 持有4G终端
C. 在4G网络覆盖下
D. 使用SIM卡
4G号码如何查询积分?()
A. 登陆网上营业厅
B. 积分商城
C. 拨打10010客服热线
D. 前往实体营业厅
2/3G转4G全国套餐/4G全国组合套餐后,怎样进行密码重置和修改?()
A. 可通过营业厅
B. 网上营业厅
C. 手机营业厅
D. 10010IVR
E. 10010人工服务