大資料發展歷程

2021-10-12 08:04:30 字數 802 閱讀 6844

任何技術的出現,在前期都是理論先行,但此時沒有應用場景,不會大規模的推開,那技術都得不到深度的發展。

任何技術深度的發展,都是在有了應用場景,降低了門檻,才會真正的發展起來。

大資料技術的發展也是這樣的歷程:

最開始是由於像谷歌,雅虎這樣的搜尋引擎,因為儲存的網頁數量巨大,才有了這樣的大資料的概念。

所以大資料最早的應用場景就是搜尋引擎,但因為此時的技術發展不成熟,最早還只是大資料的儲存,和一點簡單的大資料應用,比如檢索,主要是21世紀初。

不像現在,經過20年的發展,大資料在各行各業都有了應用,不僅僅是儲存,還包含計算和應用。

應用場景也從搜尋引擎擴充套件到醫療,社交,電商,物流,交通,旅遊等各行各業。

而大資料的發展,也從最早的大資料儲存,發展出大資料的計算,以及大資料處理的資源管理。

首先是需要解決大資料的儲存,之後是對儲存的這麼多資料進行計算處理,利用這些資料計算的結果,在處理大資料的過程中,單個機器的垂直擴充套件始終是有瓶頸,而水平擴充套件則是沒有邊界,水平擴充套件的這麼多機器就需要發展出資源管理器統一管理這些機器。這樣大資料的必須的三駕馬車就齊備了。

大資料未來如何發展?

現在大資料也被提了很多年了,也有很多從業者了,有了大資料的發展生態,不管是hadoop,spark 這些開源的框架讓從業者能夠快速搭建乙個大資料系統,構建大資料系統的應用。

那展望未來,未來我們的生產生活只會創造越來越多的資料,對這些資料進行收集,清洗,分析,應用將會成為常態;我們需要更為強大的儲存介質,計算能力,和管理系統;也許不僅僅是這三個方面,在更大資料的形態需要更高的要求。

將大資料基建化,大資料產業化,將會是未來的乙個趨勢。

大資料發展歷程

整理自 oltp 增刪改 olap 查詢 二合一的系統,隨著資料量的增大開始分庫分表。之後大量資料的處理 min max g 不易操作。所有資料匯聚到乙個中心儲存,這個中心底層是 分布式 但向上暴露的介面是 單機 的。這極大程度的降低了資料傳輸 儲存 分析的難度。歷程 hadoop 2006 年出現...

web發展歷程

每次開啟瀏覽器想要去找一些時候,總是要先找度娘 www.baidu.com 通過度娘我們可以搜尋到全網的資源,但是無論開啟那個 開頭的永遠是那雷打不動的三個 w 呢?www其實是 的姓,就好像有人姓趙,有人姓錢。這個姓誰起的呢?是一位英國計算機科學家 蒂姆 伯納斯 李。英國科學家蒂姆 伯納斯 李於1...

GAN 發展歷程

這幾年出現的比較有影響力的 gan,從最初的 goodfellow 版 gan 到近來大火的 biggan stylegan 等,部落格的後續內容也是按照這張圖的順序進行的。gan 路線圖。goodfellow 版 gan gan 是由 goodfellow 等人於 2014 年提出的 目前公認的說...