Spark Streaming将数据流以时间片为单位进行分割形成______ 能够以相对较小的时间间隔对流数据进行处理
查看答案
______ 是Spark系统中用于实时处理流数据的分布式流处理框架,扩展了Spark 流式大数据处理能力
______ 是构建在 Spark上的图计算模型,它利用spark框架提供的内存级存RDD、DAG和基于数据依赖的容错等特性,实现高效健壮的图计算框架
______ 是一个分布式机器学习库,即在Spark平台上对一些常用的机器学习算法进行了分布式实现
______ 作为 Spark大数据框架的一部分,主要用于结构化数据处理和对 Spark数据执行类SQL的查询