简介
HBase是一个基于HDFS的、分布式的、面向列(列族)的非关系型数据库(NOSQL)。
HBase的特点
1.海量数据存储,HBase表中的数据能够容纳上百亿行*上百万列。
2.面向列的存储,数据在表中是按照列进行存储的,能够动态的增加列并对列进行各种操作。
3.准实时查询,HBase在海量的数据量下能够接近准实时的查询(百毫秒以内)
4.多版本,HBase中每一列的数据都可以有多个版本。
5.可靠性,HBase中的数据存储于HDFS中且依赖于Zookeeper进行Master和RegionServer的协调管理。
HBase与关系型数据库的区别
1.HBase中的数据类型只有String,而关系型数据库中有char、varchar、int等。
2.HBase中只有普通的增删改查操作,没有表与表之间的连接、子查询等,若想要在HBase中进行复杂的操作则应该使用Phoenix。
3.HBase是基于列进行存储的,因此在查询指定列的数据时效率会很高,而关系型数据库是基于行存储,每次查询都要查询整行。
4.HBase适合海量数据存储,而关系型数据库一般一张表不超过500M,否则就要考虑分表操作。
5.HBase中为空的列不占用存储空间,表的设计可以非常稀疏,而关系型数据库中表的设计较谨密。
6.HBase不支持事务,而非关系型数据库支持事务。
7.HBase区分大小写,而SQL不区分大小写。
HBase的表结构
data:image/s3,"s3://crabby-images/4c037/4c037f2d1c58303a6f7896cb0a62e5d084a11093" alt="2a70a23c9fbb1d6c55f72086f0be433f.png"
data:image/s3,"s3://crabby-images/9622d/9622d1d017132da62f27d01c2aa38218f77ac855" alt="cd0bde29449b3c79f83bb525838db88d.png"
*HBase中的表由RowKey、ColumnFamily(列族)、Column、Timestamp组成。
Timestamp:HBase中的每个键值对都有一个时间戳,在进行插入时由HBase进行自动赋值。
data:image/s3,"s3://crabby-images/c8285/c8285f4c38156c11552e399df1296d508412e12c" alt="b6da024a284a67716de833f041265bee.png"
data:image/s3,"s3://crabby-images/b329c/b329c4b25bf9bd81153315c6c21803e7b21a15f7" alt="2607aeb69f44325bc60712faabe99bed.png"
架构
data:image/s3,"s3://crabby-images/0699e/0699e8b3c04e74c870d30de3935782a5e2923743" alt="61f293c0b8ff2d1a30a0ff57beb16b15.png"
Master
1.处理对【表】的添加、删除、查询等操作。
2.进行RegionServer的负载均衡(Region与RegionServer的分配)
3.在RegionServer宕机后负责RegionServer上的Region转移(通过WAL日志)
*Master失效仅会导致meta数据和表无法被修改,表中的数据仍然可以进行读取和写入。
RegionServer
1.处理对【表中数据】的添加、删除、修改、查询等操作。
2.维护Region并将Region中StoreFile写入到HDFS中。
3.当Region中的数据达到一定大小时进行Region的切分。
安装
data:image/s3,"s3://crabby-images/9e37a/9e37af027eb2cd207305e0e03aeff7485c2237fc" alt="af9268a44fe2430a5d4e1868f220631e.png"
data:image/s3,"s3://crabby-images/d8c07/d8c0767762442f41c3d54751c5b769027e851446" alt="0c843a3484e4a7e1c3f5639ebe9d1a80.png"
data:image/s3,"s3://crabby-images/2f616/2f616c1712c9e59acfeaab6d887da33d6d3cacc2" alt="b6bdb539dae40a3fa65e4ea1c44ab66f.png"
操作命令
data:image/s3,"s3://crabby-images/e487d/e487d289fdad6db9784333471fb8bfa99f33291d" alt="9830124169cbc8c198db7a2d7c756e54.png"
data:image/s3,"s3://crabby-images/6b732/6b732011820f9e36abfd32a561daef79bd6cc25a" alt="743c120fc4dfbfdb08b0233fcae7195a.png"
HBase 与Hive
data:image/s3,"s3://crabby-images/7589d/7589d4c783b031d5d57846b0485c98f443cc0c35" alt="7c0067eaefa1330f021bd3cb719f1619.png"
data:image/s3,"s3://crabby-images/0040c/0040c3df8d8e563e440e12b8e057f0333aebf82e" alt="eb1bda03c3787d694095e6be431bfcff.png"
案例
文章表(内容表)、用户关注与粉丝表(用户关系表)、用户发布文章表(收件箱表)
data:image/s3,"s3://crabby-images/8a899/8a899f1ba195eb191493a1132856858f1ccaf5bc" alt="777ce0077e33facc4dbbcc444349b11d.png"
参见:
HBase海量数据存储 - 辣鸡小篮子 - 博客园www.cnblogs.comdata:image/s3,"s3://crabby-images/9dcc3/9dcc36b6644b0995210ad84b9959da6e74ca541b" alt="59b60bb5e47ce00fd36a371743f30164.png"
data:image/s3,"s3://crabby-images/d18cf/d18cfcdb150d6b7cd796eea0ed978c8463f680ba" alt="63cf308fe4ea1bdfeab4b314e78bf364.png"
data:image/s3,"s3://crabby-images/d18cf/d18cfcdb150d6b7cd796eea0ed978c8463f680ba" alt="63cf308fe4ea1bdfeab4b314e78bf364.png"