列式儲存處理

下面以gbase 8a分析型資料庫為例，描述列儲存對資料儲存與管理的作用。

面對海量資料分析的 i/o 瓶頸，gbase 8a 把錶資料按列的方式儲存，其優勢體現在以下幾個方面。

不讀取無效資料：降低 i/o 開銷，同時提高每次 i/o 的效率，從而大大提高查詢效能。查詢語句只從磁碟上讀取所需要的列，其他列的資料是不需要讀取的。例如，有兩張表，每張表100gb 且有100 列，大多數查詢只關注幾個列，採用列儲存，不需要像行存資料庫一樣，將整行資料取出，只取出需要的列。磁碟 i/0 是行儲存的 1/10或更少，查詢響應時間提高 10 倍以上。

高壓縮比：壓縮比可以達到 5 ~ 20 倍以上，資料占有空間降低到傳統資料庫的1/10 ，節省了儲存裝置的開銷。

當資料庫的大小與資料庫伺服器記憶體大小之比達到或超過 2:1 （典型的大型系統配置值）時，列存的 i/o 優勢就顯得更加明顯；

gbase 8a 分析型資料庫的獨特列儲存格式，對每列資料再細分為「資料報」。這樣可以達到很高的可擴充套件性：無論乙個表有多大，資料庫只操作相關的資料報，效能不會隨著資料量的增加而下降。通過以資料報為單位進行 i/o 操作提公升資料吞吐量，從而進一步提高i/o效率。

由於採用列儲存技術，還可以實現高效的透明壓縮。

[img]

由於資料按列包儲存，每個資料報內都是同構資料，內容相關性很高，這使得gbase 8a 更易於實現壓縮，壓縮比通常能夠達到 1:10 甚至更優。這使得能夠同時在磁碟 i/o 和 cache i/o 上都提公升資料庫的效能，使 gbase 8a 在某些場景下的運算效能比傳統資料庫快 100 倍以上。

gbase 8a 允許使用者根據需要設定配置檔案，選擇是否進行壓縮。在啟用壓縮的情況下gbase 8a 根據資料的不同特性以及不同的分布狀況，自動採用相應的壓縮演算法，如：

[img]

行程編碼（適用於大量連續重複的資料，特別是排序資料）；

基於資料的差值編碼（適用於重複率低，但彼此差值較小的資料列）；

基於位置的差值編碼（適用於重複率高，但分布比較隨機的資料列）。

列式儲存處理

列式儲存簡介

列式儲存一

行式儲存與列式儲存

列式儲存處理

列式儲存簡介

列式儲存 一

行式儲存與列式儲存

相關推薦

列式儲存一