oss可用性 基於OSS的EB級資料湖

2021-10-14 01:37:37 字數 964 閱讀 5070

隨著資料量的爆發式增長,數位化轉型成為整個it行業的熱點,資料也開始需要更深度的價值挖掘,因此需要確保資料中保留的原始資訊不丟失,從而應對未來不斷變化的需求。當前以oracle為代表的資料庫中介軟體已經逐漸無法適應這樣的需求,於是業界也不斷的產生新的計算引擎,以便應對資料時代的到來。在此背景下,資料湖的概念被越來越多的人提起,希望能有一套系統在保留資料的原始資訊情況下,又能快速對接多種不同的計算平台,從而在資料時代佔據先機。

資料湖(data lake)以集中式儲存各種型別資料,包括:結構化、半結構化、非結構化資料。資料湖無需事先定義schema,資料可以按照原始形態直接儲存,覆蓋多種型別的資料輸入源。資料湖無縫對接多種計算分析平台,對hadoop生態支援良好,儲存在資料湖中的資料可以直接對其進行資料分析、處理、查詢,通過對資料深入挖掘與分析,洞察資料中蘊含的價值。

阿里雲物件儲存oss(object storage service)是阿里雲提供的海量、安全、低成本、高可靠的雲儲存服務。其資料設計永續性不低於99.9999999999%(12個9),服務可用性(或業務連續性)不低於99.995%。oss具有與平台無關的restful api介面,您可以在任何應用、任何時間、任何地點儲存和訪問任意型別的資料。

oss在作為資料湖儲存,充分滿足資料湖的關鍵特性:

海量資料儲存:

高效資料計算:

安全資料管理:綜合以上內容,在未來面向海量資料的資料湖場景下,物件儲存oss非常適合企業構建海量、高效、安全的資料湖。

更多資料湖相關資訊交流**入阿里巴巴資料湖技術釘釘群(儲存後用釘釘掃碼)

實現軟體的可用性

繼續趕超世界先進水平 常用的可用性戰術總結,通常用於以下幾個方面 1 錯誤檢測 3個戰術 命令 響應。在錯誤發生前阻止,先由本地元件進行低階判斷,再通過遠端高階判斷 心跳。定時傳送資訊或資料給檢測元件 異常。這個就不用再說了 2 錯誤恢復 4個戰術 表決。輸出評判資料,交給表決元件表決,採用 多數規...

Dubbo的高可用性

現象 zookeeper註冊中心宕機,還可以消費dubbo暴露的服務。原因 健壯性 l 監控中心宕掉不影響使用,只是丟失部分取樣資料 l 資料庫宕掉後,註冊中心仍能通過快取提供服務列表查詢,但不能註冊新服務 l 註冊中心對等集群,任意一台宕掉後,將自動切換到另一台 l註冊中心全部宕掉後,服務提供者和...

MongoDB集群的可用性測試

測試mongodb的可用性 連線正在執行的mongodb集群,檢視各分片。向test集合插入10條記錄並查詢。測試primary 成員down 機時secondary 成員是否會自動競爭為 primary 複製集shard1的 down 機前狀態 關閉server2 機器上的 mongodb 程序。...