为了实现负载均衡、提升服务器端的数据处理能力(横向扩展)、提高故障恢复能力以保证服务质量等,NoSQL数据库采取数据分布技术。( )
查看答案
在Hadoop生态系统中,()主要解决的是分布式环境下的协作服务问题,包括命名服务、状态同步、集群管理、配置同步、分布式锁、队列管理等。
A. Mahout
B. HBase
C. ZooKeeper
D. Hive
()是Hadoop分布式文件系统,是Hadoop生态系统中的数据存储基础。
A. MapReduce
B. HBase
C. HDFS
D. Hive
在Hadoop生态系统中,()是一种支持MapReduce处理的,面向结构化数据的可伸缩、高可靠、高性能、分布式和面向列的动态模式数据库,采用Google Big Table数据模型,较好的支持大规模数据的随机、实时的读写操作。
A. Mahout
B. HBase
C. Sqoop
D. Hive
在Spark的关键技术中,( )是一个容错的并行的数据结构,可以让用户显示地将数据存储到磁盘和内存中,并能控制数据的分区。
A. Shuffle
B. Storage
C. Scheduler
D. RDD (Resilient Distributed Dataset)