測試 Data Domain拔得重複資料刪除頭籌

2021-09-23 04:17:53 字數 2124 閱讀 2251

【watchstor獨家譯文】重複資料刪除技術不僅能夠提高企業儲存效率,而且可以減少購買磁帶或者磁碟等儲存裝置的需求,從而進一步節省了資料中心空間、能源和冷卻資源。

從廣義上講,重複資料刪除是一項分析資料檔案、找出和刪除冗餘資訊塊、並且採用了g-zip或者lz等壓縮演算法的技術。一般來講,那些經常被編輯但是變更很少的檔案是重複資料刪除的理想物件。因此,不少企業開始考慮採用重複資料刪除解決方案來減少企業資料庫、電子郵件、伺服器資訊以及虛擬機器映象的備份和歸檔所需的儲存空間。

而這次我們希望從乙個不同的角度來考量重複資料刪除產品。我們選擇把重點放在應用的簡便性和可能存在的問題、吞吐效能、可管理性以及功能特性。我們將先在位於紐約市的儲存實驗室進行測試,然後採訪data domain的使用者了解他們的實際應用情況,從而掌握更準確的實際重複資料刪除率。我們的主要目標是評估data domain解決方案在多站點業務連續性方面的穩定性。

我們的測試模擬了乙個擁有乙個資料中心、地區總部和分支機構的企業。該分支機構將350gb內部儲存備份到本地乙個dd120中,地區總部將1.2tb的內部儲存備份到乙個dd510中,而各個部門將資料中心兩個封裝了10tb儲存的外接驅動器備份到乙個dd690中。每個裝置都設計有最大冗餘性的電源、nic、光纖通道控制器以及raid 6磁碟陣列。我們採用了兩種方法,第乙個是使用symantec veritas netbackup軟體進行本地備份,然後使用data domain的複製技術在不同data domain裝置之間進行複製;第二種方法是採用data domain的ost來控制netbackup的所有備份和複製流程。我們發現乙個有趣的現象,如果你的企業已經採用了nbu,那麼你可以保留所有陳舊的工作和規則,只要將他們直接從磁帶驅動器遷移到data domain驅動器中就可以了。

雖然配置過程並不簡單,但是有些方面更注重企業儲存技術,而不是全面it技術。通過遠端登陸或者附加kvm使用cli來完成安裝。我發現,在第一次登陸的時候是必須要更改預設密碼的。我們安裝了儲存裝置、複製和ost的許可,然後架構網路、檔案系統、系統和管理設定。確認設定完成之後重啟系統,再開始安裝cifs和nfs共享。

檔案資料組織縝密且資訊詳盡,這遠不會降低向資料中心增加新技術可能存在的問題。例如,我們使用擴充套件套件對dd510進行公升級,在10分鐘內配置6個250gb附加驅動器,這就組成了乙個由8個磁碟構成的raid組、乙個由6個磁碟構成的raid組以及能夠被每個組使用的熱備份盤。

我們的實驗室測試過程中發現,重複資料刪除率從5倍到99倍不等,主要取決於檔案型別和相同內容備份的次數。一般來說,在你完成第一次備份之後,由於壓縮的原因不會釋放太多空間,然後在接下來的備份中能夠節省下的空間慢慢增多。許多企業在備份、歸檔和業務連續性流程方面的配置與我們沒有太大區別。在通過wan連線複製之前高效重複資料刪除所能節省下的成本和時間是非常驚人的。

在完成實驗室測試之後,我們開始對data domain進行走訪來了解實際應用過程中的重複資料刪除率。我們採訪了一家名為the rockefeller group的公司,這是一家提供商業地產、地產服務和電信服務的公司。該公司高階it服務工程師sanja kaljanac表示,他們資料中心在dd565上可以達到100倍的資料刪除率,在分支機構的dd120上可以達到67.5倍的資料刪除率。在對其他data domain使用者提供的日誌檔案進行分析後我們發現,壓縮率從10倍到40倍不等,dd690上的最高吞吐量在每秒300~500mb之間。除了rockefeller group之外,其他採用了data domain產品的地產公司還包括land america financial group and skidmore和owings and merrill。

我們的實驗室測試結果和實際調查結果表明,data domain的重複資料刪除技術在站點間或者通過wan連線的備份、恢復和歸檔方面具有一定的優勢。考慮到維持多站點企業業務連續性所需的資料量,傳統備份方法被不斷完善甚至是突破了原有的侷限性。dd120在分支機構的應用結合dd690或者dd510在資料中心應用不僅能夠消除侷限性,而且還會讓你對現有業務連續性流程進行重新評估。  

l測試產品總**:293540美元

ldd690(帶有擴充套件架的基本架構):210000美元

ldd510:19000美元

ldd510擴充套件套件:13000美元

ldd120(帶有複製功能):12500美元

ldd690複製軟體許可:35000美元

ldd510複製軟體許可:2540美元

ldd510複製軟體許可:1500美元

天貓雙十一來襲,燈飾行業誰將拔得頭籌?

今年疫情給國內外經濟帶來巨大衝擊和挑戰,同時也進一步激發了數字經濟的活力,數位化的加速推進,電商新模式迅速崛起,今年雙 11 大戰也比往年硝煙更濃,雙 11 消費熱情空前高漲。10 月 20 日零點開始,雙十一預售的號角正式吹響。隨著時間的推進,雙十一終極銷售競爭也愈演愈烈。燈飾行業眾多企業紛紛加入...

AI考拉第二屆AI之星大賽開幕,誰能拔得頭籌?

近日,廣州p2p平台ai考拉開展了第二屆ai之星評選大賽。據了解,本次大賽是由ai考拉品牌部門牽頭,號召公司各部門的員工歡聚一堂的樂事。ai程式設計客棧考拉品牌負責人表示,進入 10 月,各種跡象都顯示,p2p行業正在回暖。而我們作為p2p行業的乙份子,自然也要對這個行業的未來充滿信心。該負責人稱,...

js陣列去重效率測試

最近一次面試遇到了乙個問題,用原生js至少實現三種數思路,巴拉巴拉 描述完畢.另乙個問題又來了,請分析一下哪一種的效率最高,當時我就想,應該越是原生的 效率應該越高吧.然後就現實並非如此,面試自然也就無疾而終,然後我回家做了一番測試,結果如下 1 雙層遍歷 default 7.00708007812...