HBase系列---【(一)HBase的介绍】

发布时间 2023-04-12 00:11:26作者: 少年攻城狮

HBase的介绍及使用

1.HBase是什么

HBase是基于Google的BigTable论文,建立在HDFS之上,提供高可靠性,高性能,列存储,可伸缩,实时读写的分布式大数据数据库。

2.HBase的特点

  • 1.极易扩展,海量存储

    底层依赖HDFS,当磁盘空间不足的时候,只需要动态增加datanode节点就可以了,可以通过增加服务器来对集群的存储进行扩容。
  • 2.列式存储

    HBase表的数据是基于列族进行存储的,列族是在列的方向上的划分。
  • 3.高并发

    对大数据量的读写都能保证毫秒级响应
  • 4.稀疏

    稀疏主要是针对HBase列的灵活性,在列族中,你可以指定任意多的列,在列数据为空的情况下,是不会占用存储空间的。
  • 5.数据的多版本

    HBase表中的数据可以有多个版本值,默认情况下是根据版本号去区分,版本号就是插入数据的时间戳。
  • 6.数据类型单一

    所有的数据在HBase中是以字节数组进行存储。

3.HBase在实际场景中的应用

  • 1.交通方面

    例如:船舶GPS信息,全长江的船舶GPS信息,每天有1千万左右的数据存储。
  • 2.金融方面

    例如: 消费信息,贷款信息,信用卡还款信息等。
  • 3.电商方面

    例如:电商网站的交易信息,物流信息,游览信息等。
  • 4.电信方面

    通话信息,语音详单等。

    总结: 海量明细数据的存储,并且后期需要有很好的查询性能。

注意:HBase和Hive的区别?

Hive适合用来对一段时间内的数据进行分析查询,例如,用来计算趋势或者网站的日志。Hive不应该用来进行实时的查询。因为它需要很长时间才可以返回结果。

Hbase非常适合用来进行大数据的实时查询,随机访问。Facebook用Hbase进行消息和实时的分析。它也可以用来统计Facebook的连接数。