其他类 - CDA数据分析师

多选题

以下哪些项是HDFS（Hadoop分布式文件系统）设计的前景和目标？（）

A. 大数据
B. 硬件错误是常态
C. 流式数据访问
D. 简单一致性

查看答案

多选题

在HDFS中，NameNode是用来管理文件系统的命名空间的。它将所有的文件和文件夹的元数据保存在一个文件系统树中。这些信息也会在硬盘上保存成以下文件：（）

A. 命名空间镜像
B. 修改日志
C. 数据块block
D. 分片文件

查看答案

多选题

cache和pesist的描述，正确的是（）

A. cache和persist都是用于将一个RDD进行缓存的，这样在之后使用的过程中就不需要重新计算了，可以大大节省程序运行时间
B. cache只有一个默认的缓存级别MEMORY_ONLY
C. persist可调用cache，而cache可以根据情况设置缓存级别
D. executor执行的时候，默认60%做cache，40%做task操作，persist最根本的函数，最底层的函数

查看答案

多选题

如果要将一个本地用户主目录下的数据文件a.data，上传到HDFS文件系统的/test-data/目录下，执行以下哪些命令可以实现？（）

A. hadoopfs-copyFromLocal~/a.data/test-data/
B. hadoopfs-put~/a.data/test-data/
C. hdfsfs-copyFromLocal~/a.data/test-data/
D. hdfsdfs-copyFromLocal~/a.data/test-data/

查看答案

多选题