()是Hadoop分布式文件系统,是Hadoop生态系统中的数据存储基础。
A. MapReduce
B. HBase
C. HDFS
D. Hive
查看答案
在Hadoop生态系统中,()是一种支持MapReduce处理的,面向结构化数据的可伸缩、高可靠、高性能、分布式和面向列的动态模式数据库,采用Google Big Table数据模型,较好的支持大规模数据的随机、实时的读写操作。
A. Mahout
B. HBase
C. Sqoop
D. Hive
在Spark的关键技术中,( )是一个容错的并行的数据结构,可以让用户显示地将数据存储到磁盘和内存中,并能控制数据的分区。
A. Shuffle
B. Storage
C. Scheduler
D. RDD (Resilient Distributed Dataset)
NoSQL数据库中常用的数据模型有()、Key-Document、Key-Column和图存储模型。
A. Key
B. Value
C. Key-Value
D. Key-State
CAP理论的基本思想是:一个分布式系统中不能同时满足 () 、可用性和分区容错性等需求,而最多只能同时满足其中的两个特征。
A. 一致性
B. 排他性
C. 正确性
D. 准确性