物件儲存系統概念

2021-08-09 14:43:54 字數 3335 閱讀 6638

什麼是物件儲存(osd)?

儲存區域網(san)和網路附加儲存(nas)是目前兩種主流網路儲存架構,而物件儲存(object-based storage)是一種新的網路儲存架構,基於物件儲存技術的裝置就是物件儲存裝置(object-based storage device)簡稱osd。2023年成立的全球網路儲存工業協會(snia)的物件儲存裝置(object storage device)工作組發布了ansi的x3t10標準。總體上來講,物件儲存(object-based storage, obs)綜合了nas和san的優點,同時具有san的高速直接訪問和nas的分布式資料共享等優勢,提供了具有高效能、高可靠性、跨平台以及安全的資料共享的儲存體系結構。

san儲存架構

採用scsi 塊i/o的命令集,通過在磁碟或fc(fiber channel)級的資料訪問提供高效能的隨機i/o和資料吞吐率,它具有高頻寬、低延遲的優勢,在高效能計算中占有一席之地,如sgi的cxfs檔案系統就是基於san實現高效能檔案儲存的,但是由於san系統的**較高,且可擴充套件性較差,已不能滿足成千上萬個cpu規模的系統。

nas儲存架構

它採用nfs或cifs命令集訪問資料,以檔案為傳輸協議,通過tcp/ip實現網路化儲存,可擴充套件性好、**便宜、使用者易管理,如目前在集群計算中應用較多的nfs檔案系統,但由於nas的協議開銷高、頻寬低、延遲大,不利於在高效能集群中應用。

物件儲存架構

核心是將資料通路(資料讀或寫)和控制通路(元資料)分離,並且基於物件儲存裝置(object-based storage device,osd)構建儲存系統,每個物件儲存裝置具有一定的智慧型,能夠自動管理其上的資料分布。物件儲存結構由物件、物件儲存裝置、元資料伺服器、物件儲存系統的客戶端四部分組成。

物件儲存架構

1、物件

物件是系統中資料儲存的基本單位,每個object是資料和資料屬性集的綜合體,資料屬性可以根據應用的需求進行設定,包括資料分布、服務質量等。在傳統的儲存系統中用檔案或塊作為基本的儲存單位,塊裝置要記錄每個儲存資料塊在裝置上的位置。object維護自己的屬性,從而簡化了儲存系統的管理任務,增加了靈活性。object的大小可以不同,可以包含整個資料結構,如檔案、資料庫表項等。在儲存裝置中,所有物件都有乙個物件標識,通過物件標識osd命令訪問該物件。通常有多種型別的物件,儲存裝置上的根物件標識儲存裝置和該裝置的各種屬性,組物件是儲存裝置上共享資源管理策略的物件集合等。

傳統塊儲存與物件儲存

物件的組成

傳統的訪問層次和虛擬資料訪問模型

2、物件儲存裝置

每個osd都是乙個智慧型裝置,具有自己的儲存介質、處理器、記憶體以及網路系統等,負責管理本地的object,是物件儲存系統的核心。osd同塊裝置的不同不在於儲存介質,而在於兩者提供的訪問介面。osd的主要功能包括資料儲存和安全訪問。目前國際上通常採用刀片式結構實現物件儲存裝置。osd提供三個主要功能:

(1) 資料儲存。osd管理物件資料,並將它們放置在標準的磁碟系統上,osd不提供塊介面訪問方式,client請求資料時用物件id、偏移進行資料讀寫。

(2) 智慧型分布。osd用其自身的cpu和記憶體優化資料分布,並支援資料的預取。由於osd可以智慧型地支援物件的預取,從而可以優化磁碟的效能。

(3) 每個物件元資料的管理。osd管理儲存在其上物件的元資料,該元資料與傳統的inode元資料相似,通常包括物件的資料塊和物件的長度。而在傳統的nas系統中,這些元資料是由檔案伺服器維護的,物件儲存架構將系統中主要的元資料管理工作由osd來完成,降低了client的開銷。

傳統模型 vs osd模型

3、元資料伺服器(metadata server,mds)

mds控制client與osd物件的互動,為客戶端提供元資料,主要是檔案的邏輯檢視,包括檔案與目錄的組織關係、每個檔案所對應的osd等。主要提供以下幾個功能:

(1) 物件儲存訪問。mds構造、管理描述每個檔案分布的檢視,允許client直接訪問物件。mds為client提供訪問該檔案所含物件的能力,osd在接收到每個請求時將先驗證該能力,然後才可以訪問。

(2) 檔案和目錄訪問管理。mds在儲存系統上構建乙個檔案結構,包括限額控制、目錄和檔案的建立和刪除、訪問控制等。

(3) client cache一致性。為了提高client效能,在物件儲存系統設計時通常支援client方的cache。由於引入client方的cache,帶來了cache一致性問題,mds支援基於client的檔案cache,當cache的檔案發生改變時,將通知client重新整理cache,從而防止cache不一致引發的問題。

4、物件儲存系統的客戶端client

為了有效支援client支援訪問osd上的物件,需要在計算節點實現物件儲存系統的client。現有的應用對資料的訪問大部分都是通過posix檔案方式進行的,物件儲存系統提供給使用者的也是標準的posix檔案訪問介面。介面具有和通用檔案系統相同的訪問方式,同時為了提高效能,也具有對資料的cache功能和檔案的條帶功能。同時,檔案系統必須維護不同客戶端上cache的一致性,保證檔案系統的資料一致。檔案系統讀訪問流程:

1)客戶端應用發出讀請求;

2)檔案系統向元資料伺服器傳送請求,獲取要讀取的資料所在的osd;

3)然後直接向每個osd傳送資料讀取請求;

4)osd得到請求以後,判斷要讀取的object,並根據此object要求的認證方式,對客戶端進行認證,如果此客戶端得到授權,則將object的資料返回給客戶端;

5)檔案系統收到osd返回的資料以後,讀操作完成。

物件儲存檔案系統的關鍵技術

1、分布元資料 傳統的儲存結構元資料伺服器通常提供兩個主要功能。

(1)為計算結點提供乙個儲存資料的邏輯檢視(virtual file system,vfs層),檔名列表及目錄結構。

(2)組織物理儲存介質的資料分布(inode層)。物件儲存結構將儲存資料的邏輯檢視與物理檢視分開,並將負載分布,避免元資料伺服器引起的瓶頸(如nas系統)。元資料的vfs部分通常是元資料伺服器的10%的負載,剩下的90%工作(inode部分)是在儲存介質塊的資料物理分布上完成的。在物件儲存結構,inode工作分布到每個智慧型化的osd,每個osd負責管理資料分布和檢索,這樣90%的元資料管理工作分布到智慧型的儲存裝置,從而提高了系統元資料管理的效能。另外,分布的元資料管理,在增加更多的osd到系統中時,可以同時增加元資料的效能和系統儲存容量。

2、併發資料訪問 物件儲存體系結構定義了乙個新的、更加智慧型化的磁碟介面osd。osd是與網路連線的裝置,它自身包含儲存介質,如磁碟或磁帶,並具有足夠的智慧型可以管理本地儲存的資料。計算結點直接與osd通訊,訪問它儲存的資料,由於osd具有智慧型,因此不需要檔案伺服器的介入。如果將檔案系統的資料分布在多個osd上,則聚合i/o速率和資料吞吐率將線性增長,對絕大多數linux集群應用來說,持續的i/o聚合頻寬和吞吐率對較多數目的計算結點是非常重要的。物件儲存結構提供的效能是目前其它儲存結構難以達到的,如activescale物件儲存檔案系統的頻寬可以達到10gb/s。

智慧型儲存系統概念解析

原文出處 emc中文支援論壇 智慧型儲存系統是配置了多塊硬碟和大量記憶體,並提供多條 i o通路,擁有智慧型作業系統的儲存陣列。它採用複雜的演算法來實現最優化的儲存資源處理,以滿足高效能需求的應用程式。本文將介紹 智慧型儲存系統的組成部件。一般來說,前端 快取 後端和物理磁碟四部分構成乙個智慧型儲存...

儲存系統 基本概念

目錄效能指標 層次化結構 全部總覽 本節總覽 根據作用分類 高速緩衝儲存器 cache 主儲存器 主存 記憶體 輔助儲存器 輔存 外存 按照材料分類 磁表面儲存器 磁碟 直接訪問 磁帶 順序訪問 磁芯儲存器 半導體儲存器 隨機訪問 訪問時間與儲存單元位置無關。隨機儲存器ram 易失性 唯讀儲存器ro...

分布式儲存系統基本概念

參考 大規模分布式儲存系統 楊傳輝 非結構化資料 辦公文件 文字。視音訊等 結構化資料 可以設計成二維關係表來儲存,資料屬性基本固定,資料的模式 字段 資料間關係 個表之間的關係 要預先定義 半結構化 資料的模式和內容混在一起,沒有明顯區分,也不需要預先定義資料的模式結構 根據不同的資料型別,分布式...