《HBase權威指南》一導讀

2021-09-23 16:50:01 字數 1619 閱讀 6294

hbase權威指南

你閱讀本書的理由可能有很多。可能是因為聽說了hadoop,並了解到它能夠在合理的時間範圍內處理pb級的資料,在研讀hadoop的過程中發現了乙個處理隨機讀寫的系統,它叫做hbase。或者將其稱為目前流行的一種新的資料儲存架構,傳統資料庫解決大資料問題時成本更高,更適合的技術範圍是nosql。

無論你是如何來到這裡的,我都希望你能夠了解並學習如何在企業或組織中使用hbase解決海量資料問題。你可能有關係型資料庫的背景,但更希望去研究這個「列式儲存」系統;也許你聽說hbase能夠不費力地進行線性拓展,並且有足夠的理由成為下一代網路系統。

在2023年年底,我曾面臨百萬級的文件儲存需求,並且需要滿足容錯和可擴充套件等要求。我擁有豐富的mysql資料庫經驗,並使用這種資料庫來儲存資料,最終服務於我的**的使用者。mysql可以在執行於一台伺服器的同時,擁有另一台備份伺服器,其無法應對如此海量資料的處理,於是我只好尋找其他可用的儲存資料庫。

我的口頭禪是:「google是如何解決這類問題的?」後來我接觸了hadoop,在短暫使用hadoop之後,我面臨隨機讀寫的問題——但是這個問題已經得以解決:2023年google發表了bigtable①**,hadoop開發者擁有了bigtable的開源實現,並稱其為hbase。這就是解決我的問題的答案,所以這一切看起來順理成章……

如今,我已經不再回憶自己剛開始接觸hadoop和hbase的日子有多艱難了。我希望可以從今天開始使用hbase,hbase目前已經成熟,接近1.0版本,並且目前已經有大量知名企業在使用,如facebook、adobe、twitter、yahoo!、趨勢科技和stumbleupon(我的集群是第乙個生產集群(迄今為止),到目前也遇到了許多有趣的問題。

如預期所料,hbase從0.1x版本開始成為社群專案,我有幸為這個專案貢獻**,並最終被要求成為全職的committer。

過去幾年我從其他開發者身上學到了許多知識,並且一直在努力地學習。我的信念是,我們還遠沒有達到這個技術的頂峰,而這個技術也會隨著時間的推移不斷地成長和演變。讓我們用這本書對整個hbase開發者社群致以敬意,我的寫作目標不僅僅是覆蓋hbase的工作機制,而且還要為使用者提供如何將這一技術用到自己的使用場景中。

我強烈地感覺到你來到這裡的原因是打算使用hbase解決你遇到的問題。現在讓我們來解開謎底。

第1章  簡介

1.1  海量資料的黎明

1.2  關係資料庫系統的問題

1.3  非關係型資料庫系統not-only-sql(簡稱nosql)

1.4  結構

1.5  hbase:hadoop資料庫

第2章 安裝

第3章  客戶端api:基礎知識

3.1  概述

3.2  crud操作

3.3  批量處理操作

3.4  行鎖

3.5  掃瞄

3.6  各種特性

第4章 客戶端api:高階特性

第5章 客戶端api:管理功能

第6章 可用客戶端

第7章 與mapreduce整合

第8章 架構

第9章 高階用法

第10章 集群監控

第11章 效能優化

第12章 集群管理

《Ansible權威指南 》一 導讀

第一篇 基礎入門篇 第1章 ansible基礎入門 1.1 ansible是什麼 1.2 ansible發展史 1.3 為什麼選擇ansible 1.4 ansible是如何工作的 1.5 ansible通訊發展史 1.6 ansible應用場景 1.7 ansible的安裝部署 1.7.1 pip...

《Fiddler除錯權威指南》 導讀

前言 fiddler是一種流行的web除錯 它功能強大,介面友好,簡單易用,無論對開發人員或者測試人員來說,都是非常有用的工具。本書是fiddler的開發者eric lawrence編寫的一本權威的參考指南。全書分為10章和4個附錄,從認識fiddler開始,介紹了基本技巧和概念 配置選項 insp...

hadoop 權威指南 HBase

hbase原理 基本概念 基本架構 應用將資料儲存在帶標籤的表中,表的單元格是行和列座標的座標交集,他們有版本號。在預設情況下版本號是單元格插入時hbase自動分配的時間戳。表的單元格內容是乙個未解釋的位元組陣列 錶行的鍵也是位元組陣列。行鍵是表的主鍵,被用來對錶行進行排序。錶行的列分組,形成列族 ...