大資料學習之路50 hbase的定址機制原理解析

每個region server管理著許多的region,而集群中又有許多的region server,假如我們要查詢一條資料的話，又如何知道我們要查詢的那條資料在哪個region server的哪個region上呢？

當然我們也可以採用hdfs的namenode機制，記錄每個檔案有哪些block，這些block在**。但是我們也可以發現這種方式很麻煩，一旦namenode掛掉就會非常麻煩。而且還經常要去做合併，恢復。

hbase換了另外一種方式，而且這種方式比原來的方式更好。這其中hmaster不會像namende那樣去管理，它根本不管這個事情，它只負責region server之間的負載均衡。他是通過二級索引的方式找到所要的資料的位置的。客戶端通過zookeeper找到root表的位置，root表中儲存了meta表的整體資料範圍及meta表的位置。meta表中記錄了更細化的資料範圍，以及使用者表的region位置。當然如果每次都這樣查詢肯定也會耗費時間，所以路由快取會把查過的資料暫存。這樣速度就會很快。