07
1.理解HBase表模型及四維坐標:行鍵、列族、列限定符和時間戳。
HBase是一個開源可伸縮的針對海量數據存儲的分布式nosql數據庫,它根據Google Bigtable數據模型來建模并構建在hadoop的hdfs存儲系統之上。它和關系型數據庫Mysql, Oracle等有明顯的區別,HBase的數據模型犧牲了關系型數據庫的一些特性但是卻換來了極大的可伸縮性和對表結構的靈活操作。
在一定程度上,Hbase又可以看成是以行鍵(Row Key),列標識(column qualifier),時間戳(timestamp)標識的有序Map數據結構的數據庫,具有稀疏,分布式,持久化,多維度等特點。
行鍵:每個HBase表都由若干行組成,每個行由行鍵(row key)來標識。在表里面,每一行代表著一個數據對象。每一行都是由一個行鍵(Row Key)和一個或者多個列組成的。行鍵是行的唯一標識,行鍵并沒有什么特定的數據類型,以二進制的字節來存儲,按字母順序排序。
列族:一個HBase表備份組成許多"列族"(Column Family)的集合,他是基本的訪問控制單元
列限定符:列族里的數據通過列限定符(或例)來定位
時間戳:每個單元格都保存著一份數據的多個版本,這些版本采用時間戳進行索引
2.啟動HDFS,啟動HBase,進入HBaseShell命令行。

3.列出HBase中所有的表信息list

4.創建表create

5.查看表詳情desc

6.插入數據put
7.查看表數據scan,get

8.多版本實驗:修改列族版本數,插入多版本數據,查看多版本數據

浙公網安備 33010602011771號