题目内容

______ 是一个分布式机器学习库,即在Spark平台上对一些常用的机器学习算法进行了分布式实现

查看答案
更多问题

______ 作为 Spark大数据框架的一部分,主要用于结构化数据处理和对 Spark数据执行类SQL的查询

Spark内核会在需要计算发生的时刻绘制一张关于计算路径的______ 简称DAG

RDD的______ 操作返回的结果把RDD持久化起来,是一个真正触发执行的过程

RDD提供了丰富的编程接口来操作数据集合,一种是______ 操作,另一种是 Action操作

答案查题题库