题目内容

下面关于Spark Streaming的描述正确的是:( )

A. Spark Streaming是构建在Spark Core上的实时计算框架,它扩展了Spark处理大规模流式数据的能力
B. Spark Streaming可结合批处理和交互查询,适合一些需要对历史数据和实时数据进行结合分析的应用场景
C. Spark Streaming可整合多种输入数据源,如Kafka、Flume、HDFS,甚至是普通的TCP套接字
D. Spark Streaming实际上是以一系列微小批处理来模拟流计算

查看答案
更多问题

Structured Streaming包括哪两种处理模型:( )

A. 微批处理
B. 高阶处理
C. 分层处理
D. 持续处理

关于Structured Streaming、Spark SQL、Spark Streaming,下面描述正确的是:( )

A. Structured Streaming处理的数据跟Spark Streaming一样,也是源源不断的数据流
B. Spark Streaming采用的数据抽象是DataFrame,Structured Streaming采用的数据抽象是DStream
C. Structured Streaming可以使用Spark SQL的DataFrame/Dataset来处理数据流
D. Spark SQL只能处理静态的数据,而Structured Streaming可以处理结构化的数据流

Flink系统主要由哪两个组件组成:( )

A. JobManager
B. TaskManager
C. JobTracker
D. TaskTracker

下面关于大数据编程框架Beam的描述正确的是:( )

A. Beam是由微软公司贡献的Apache顶级项目
Beam的目标是为开发者提供一个易于使用、却又很强大的数据并行处理模型,能够支持流处理和批处理
C. Beam是一个开源的统一的编程模型,开发者可以使用Beam SDK来创建数据处理管道,然后,这些程序可以在任何支持的执行引擎上运行
D. Beam SDK定义了开发分布式数据处理任务业务逻辑的API接口,即提供一个统一的编程接口给到上层应用的开发者

答案查题题库