HBase
1. 特性
rowkey 行键(自定义,但是必须有,而且唯一);列族,列族里储存的是 k,v 的形式,并且 v 可以储存多个不同的值,根据时间戳来判断版本,默认返回最近更新的版本;根据 rowkey 的范围来划分不同的 region 区域,然后由不同的 hbase 服务器(region server)来管理不同的 region,这样可以缓解服务器的压力;表在 hdfs 存储时,会按照 region 来创建不同的文件夹,然后再根据列族划分更细的文件夹,最后才是最终文件数据(如果数据量很小的话,会直接保存在 region server 下的一个 memstore 里,另外热数据也会保存在 memstore 里,保证快速查找,缓存空间满了后会写入文件)