作业7 Spark

发布时间 2024-01-09 16:20:46作者: wardream

一. 多选题(共5题,71.4分)

1. (多选题)Spark具有的主要特点包括:

  • A. 容易使用
  • B. 运行模式多样
  • C. 运行速度快
  • D. 通用性
我的答案: ABCD:容易使用; 运行模式多样; 运行速度快; 通用性;正确答案: ABCD:容易使用; 运行模式多样; 运行速度快; 通用性;
 
14.2分

2. (多选题)Spark所采用Executor的优点包括:

  • A. 存储模块全部都只能在内存中完成
  • B. 利用多线程来执行具体的任务
  • C. 多线程之间的数据共享
  • D. Executor中有一个BlockManager存储模块,有效减少IO开销
我的答案: BD:利用多线程来执行具体的任务; Executor中有一个BlockManager存储模块,有效减少IO开销;正确答案: BD:利用多线程来执行具体的任务; Executor中有一个BlockManager存储模块,有效减少IO开销;
 
14.3分

3. (多选题)Scala的特性包括:

  • A. Scala语法复杂
  • B. Scala兼容Java
  • C. 运行速度快
  • D. Scala具备强大的并发性
我的答案: ABCD:Scala语法复杂; Scala兼容Java; 运行速度快; Scala具备强大的并发性;正确答案: BCD:Scala兼容Java; 运行速度快; Scala具备强大的并发性;
 
0分

4. (多选题)Apache软件基金会最重要的三大分布式计算系统开源项目

  • A. Hadoop
  • B. Storm
  • C. Spark
  • D. Hive
我的答案: ABC:Hadoop; Storm; Spark;正确答案: ABC:Hadoop; Storm; Spark;
 
14.3分

5. (多选题)Spark最主要的优点是()

  • A. 基于DAG的任务调度执行机制
  • B. 提供了单一数据集操作类型
  • C. Spark提供了内存计算
  • D. 计算模式只能是MapReduce
我的答案: AC:基于DAG的任务调度执行机制; Spark提供了内存计算;正确答案: AC:基于DAG的任务调度执行机制; Spark提供了内存计算;
 
14.3分

二. 单选题(共1题,14.3分)

6. (单选题)在实际应用中,大数据处理不包括哪些类型?

  • A. 基于离线数据的处理
  • B. 基于实时数据流的数据处理
  • C. 基于历史数据的交互式查询
  • D. 复杂的批量数据处理
我的答案: A:基于离线数据的处理;正确答案: A:基于离线数据的处理;
 
14.3分