作业2 分布式文件系统HDFS

发布时间 2024-01-09 16:20:45作者: wardream

一. 单选题(共10题,20分)

1. (单选题, 2分)分布式文件系统指的是什么?

  • A. 把文件分布存储到多个计算机节点上,成千上万的计算机节点构成计算机集群
  • B.用于在Hadoop与传统数据库之间进行数据传递
  • C. 一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统
  • D. 一种高吞吐量的分布式发布订阅消息系统,可以处理消费者规模的网站中的所有动作流数据
正确答案: A:把文件分布存储到多个计算机节点上,成千上万的计算机节点构成计算机集群;

2. (单选题, 2分)下面哪一项不属于计算机集群中的节点?

  • A.主节点(Master Node) 
  • B. 从节点(Slave Node)
  • C.源节点(SourceNode)
  • D.名称结点(NameNode)

     

正确答案: C:源节点(SourceNode) ;
 

3. (单选题, 2分)在HDFS中,默认一个块多大?

  • A.16KB 
  • B. 32KB
  • C. 128KB
  • D. 64MB
正确答案: D:64MB;
 

4. (单选题, 2分)下列哪一项不属于HDFS采用抽象的块概念带来的好处?

  • A.简化系统设计
  • B.支持大规模文件存储
  • C.强大的跨平台兼容性
  • D.适合数据备份

     

正确答案: C:强大的跨平台兼容性 ;
 

5. (单选题, 2分)在HDFS中,NameNode的主要功能是什么?

  • A.维护了block id 到datanode本地文件的映射关系
  • B.存储文件内容
  • C.文件内存保存在磁盘中
  • D.存储元数据

     

正确答案: D:存储元数据 ;
 
 

6. (单选题, 2分)下面对FsImage的描述,哪个是错误的?

  • A. FsImage用于维护文件系统树以及文件树中所有的文件和文件夹的元数据
  • B. FsImage文件包含文件系统中所有目录和文件inode的序列化形式
  • C.FsImage文件记录了每个块具体被存储在哪个数据节点 
  • D. FsImage文件没有记录每个块存储在哪个数据节点

     正确答案: C:FsImage文件记录了每个块具体被存储在哪个数据节点 ;

 

7. (单选题, 2分)下面对SecondaryNameNode第二名称节点的描述,哪个是错误的?

  • A. SecondaryNameNode通过HTTPGET方式从NameNode上获取到FsImage和EditLog文件,并下载到本地的相应目录下
  • B. 它是用来保存名称节点中对HDFS元数据信息的备份,并减少名称节点重启的时间
  • C.SecondaryNameNode一般是并行运行在多台机器上
  • D. SecondaryNameNode是HDFS架构中的一个组成部分
正确答案: C:SecondaryNameNode一般是并行运行在多台机器上 ;
 
 

8. (单选题, 2分)HDFS采用了什么模型?

  • A.分层模型
  • B主从结构模型
  • C.管道-过滤器模 
  • D.点对点模型

     

正确答案: B:主从结构模型 ;
 
 

9. (单选题, 2分)在Hadoop项目结构中,HDFS指的是什么?

  • A. Hadoop上的数据仓库
  • B.资源管理和调度器
  • C. 流数据读写
  • D.分布式文件系统

     正确答案: D: 分布式文件系统 ;

 
 

10. (单选题, 2分)下列关于HDFS的描述,哪个不正确?

  • A. HDFS采用块的概念,使得系统的设计变得更加复杂
  • B.HDFS采用了主从(Master/Slave)结构模型
  • C.HDFS采用了冗余数据存储,增强了数据可靠性
  • D. HDFS还采用了相应的数据存放、数据读取和数据复制策略,来提升系统整体读写响应性能

     

正确答案: A: HDFS采用块的概念,使得系统的设计变得更加复杂 ;
 
 

二. 多选题(共10题,20分)

11. (多选题, 2分)HDFS要实现以下哪几个目标?

  • A.复杂的文件模型
  • B. 兼容廉价的硬件设备
  •  C.大数据集

  • D.流数据读写

     

正确答案: BCD: 兼容廉价的硬件设备 ; 大数据集 ; 流数据读写 ;
 

12. (多选题, 2分)HDFS特殊的设计,在实现优良特性的同时,也使得自身具有一些应用局限性,主要包括以下哪几个方面?

  • A.无法高效存储大量小文件
  • B.较差的跨平台兼容性
  • C不支持多用户写入及任意修改文件
  • D.不适合低延迟数据访问

    正确答案: ACD:无法高效存储大量小文件 ; 不支持多用户写入及任意修改文件 ; 不适合低延迟数据访问 ;

 
 

13. (多选题, 2分)HDFS采用抽象的块概念可以带来以下哪几个明显的好处?

  • A.支持大规模文件存储
  • B适合数据备份
  • C支持小规模文件存储
  • D.简化系统设计

    正确答案: ABD: 支持大规模文件存储 ; 适合数据备份 ; 简化系统设计 ;

 
 

14. (多选题, 2分)在HDFS中,名称节点(NameNode)主要保存了哪些核心的数据结构?

  • A.

    DN8

     

  • B.

    Block

     

  • C.

     FsImage

     

  • D.

    EditLog

     

我的答案: CD: FsImage ; EditLog ;正确答案: CD: FsImage ; EditLog ;
 
2分

15. (多选题, 2分)数据节点(DataNode)的主要功能包括哪些?

  • A.

    负责数据的存储和读取

     

  • B. 根据客户端或者是名称节点的调度来进行数据的存储和检索
  • C.

    向名称节点定期发送自己所存储的块的列表

     

  • D.

    用来保存名称节点中对HDFS元数据信息的备份,并减少名称节点重启的时间

     

我的答案: ABC:负责数据的存储和读取 ; 根据客户端或者是名称节点的调度来进行数据的存储和检索; 向名称节点定期发送自己所存储的块的列表 ;正确答案: ABC:负责数据的存储和读取 ; 根据客户端或者是名称节点的调度来进行数据的存储和检索; 向名称节点定期发送自己所存储的块的列表 ;
 
2分

16. (多选题, 2分)HDFS的命名空间包含什么?

  • A.

    文件

     

  • B.

     

  • C.

    磁盘

     

  • D.

    目录

     

我的答案: ABD:文件 ; 块 ; 目录 ;正确答案: ABD:文件 ; 块 ; 目录 ;
 
2分

17. (多选题, 2分)下列对于客服端的描述,哪些是正确的?

  • A. 客户端是用户操作HDFS最常用的方式,HDFS在部署时都提供了客户端
  • B.

    HDFS客户端是一个库,暴露了HDFS文件系统接口

     

  • C. 严格来说,客户端并不算是HDFS的一部分
  • D.

    客户端可以支持打开、读取、写入等常见的操作

     

我的答案: ABCD:客户端是用户操作HDFS最常用的方式,HDFS在部署时都提供了客户端; HDFS客户端是一个库,暴露了HDFS文件系统接口 ; 严格来说,客户端并不算是HDFS的一部分; 客户端可以支持打开、读取、写入等常见的操作 ;正确答案: ABCD:客户端是用户操作HDFS最常用的方式,HDFS在部署时都提供了客户端; HDFS客户端是一个库,暴露了HDFS文件系统接口 ; 严格来说,客户端并不算是HDFS的一部分; 客户端可以支持打开、读取、写入等常见的操作 ;
 
2分

18. (多选题, 2分)HDFS只设置唯一一个名称节点,这样做虽然大大简化了系统设计,但也带来了哪些明显的局限性?

  • A.

    命名空间的限制

     

  • B. 性能的瓶颈
  • C.

    隔离问题

     

  • D.

    集群的可用性

     

我的答案: ABCD:命名空间的限制 ; 性能的瓶颈; 隔离问题 ; 集群的可用性 ;正确答案: ABCD:命名空间的限制 ; 性能的瓶颈; 隔离问题 ; 集群的可用性 ;
 
2分

19. (多选题, 2分)HDFS数据块多副本存储具备以下哪些优点?

  • A.

    加快数据传输速度

     

  • B.

     适合多平台上运行

     

  • C.

      容易检查数据错误

     

  • D.

    保证数据可靠性

     

我的答案: ACD:加快数据传输速度 ; 容易检查数据错误 ; 保证数据可靠性 ;正确答案: ACD:加快数据传输速度 ; 容易检查数据错误 ; 保证数据可靠性 ;
 
2分

20. (多选题, 2分)HDFS具有较高的容错性,设计了哪些相应的机制检测数据错误和进行自动恢复?

  • A.

    数据节点出错

     

  • B.

     数据出错

     

  • C.

     名称节点出错

     

  • D.

    数据源太大

     

我的答案: ABC:数据节点出错 ; 数据出错 ; 名称节点出错 ;正确答案: ABC:数据节点出错 ; 数据出错 ; 名称节点出错 ;