对MLlib的特点描述正确的是()
A. 运算速度快,适用于具有较多迭代次数的算法
B. 具有易用性,RDD中封装了大量的操作,ᨀ供了经典机器学习算法的API
C. 集成度高,能够与Spark上的其他组件进行无缝对接
D. 运行原理是将Spark程序转换为MapReduce程序运行,并行度高
对于MLlib中向量与LabledPoint,以下描述正确的是()
A. LabledPoint是一种基于向量扩展得到的数据结构
B. 向量既可以是本地的也可以是分布式的
C. MLlib中既可以定义稀疏向量也可以定义密集向量
D. 在LabledPoint中除了包含一个向量成员外,还包含一个Double类型的标识成员
以下属于MLlib中能够实的接口有()
A. KMeans
B. SVMWithSGD
C. ALS
D. LinearRegressionWithSGD
SparkStreaming可以对多种数据源()进行类似Map、Reduce和Join等复杂操作。
A. Kdfka
B. Flume
C. Twitter
D. Zero