快Hadoop三倍分布式架構Mapr誕生

2021-05-25 00:30:29 字數 1149 閱讀 6587

[日期:2011-04-09]

[字型:大 中 小]

mapr官網截圖

日前在紐約舉行的乙個海量資料結構化會議上,通過了乙個新的面向終端裝置的分布式架構計畫——mapr。

據了解,mapr是hadoop中的乙個特殊版本,並有可能在今年晚些時候推出。該公司位於加州的san jose,此公司對此已經進行了為期兩年的研究。

根據美國**交易委員會提交的檔案顯示,該公司已經從barry eggers風險投資公司和peter sonsini新企業協會上籌集到了約900萬美元的資金。而根據該公司的**上的顯示內容表示,mapr的相關技術將改變map/reduce相關的體系規則,但它的作為遠不止這些。(

mapr能做什麼?

據介紹,marp是乙個比現有hadoop分布式檔案系統還要快三倍的產品,並且也是開源的。mapr配備了快照,並號稱不會出現spof單節點故障,且被認為是與現有hdfs的api相容。因此非常容易替換原有的系統。

mapr背後的技術大牛

不容忽視的是,幾個頂尖技術人員對mapr的誕生起了決定性的作用。

其中乙個是m.c. srivas,這是一位前google員工,也是該公司的創始人和首席技術官。

john schroeder,是lightspeed vc、calista technologies(被微軟收購)、rainfinity(被emc收購)的前首席執行官。並且是marp的共同創始人。

marp首席應用架構師ted dunning

ted dunning是site tuner 和veoh networks首席科學家,marp首席應用架構師。他創造了musicmatch公司,這也是在itune**服務普及之前是非常受歡迎的公司。同時他也是apache mahout資料探勘專案的關鍵人物。

hadoop的未來或因mapr改變

儘管apache的hadoop仍然是目前使用最廣泛的開源分布式計算版本,但競爭對手正對其虎視眈眈,比如cloudera、mapr這些。在現階段,mapr可能比apache hadoop有不止一點的優勢,但是apache也正在努力改善其分布式系統hdfs的架構,並可能在2023年的使其具備快照功能。(李智/譯)

Hadoop分布式系統架構詳解

主要思想是 分組合併 思想。分組 比如 有乙個大型資料,那麼他就會將這個資料按照演算法分成多份,每份儲存在 從屬主機上,並且在從屬主機上進行計算,主節點主要負責hadoop兩個關鍵功能模組hdfs map reduce的監督。合併 將每個機器上的計算結果合併起來 再在一台機器上計算,得到最終結果。這...

架構三 引入本地快取和分布式快取

其實這個階段拿出分布式快取,有些早,前期主要用的是本地快取,我使用到的技術主要是ehcahe,這個記憶體基本就存在你應用執行的伺服器上面,這個有個很大的問題就是,不適合長久儲存,如果長久儲存,資料量很大的時候,會占用你的服務記憶體很大一部分空間,分布式快取用的比較多的是memcached以及後期的r...

從單塊架構到分布式架構之資料庫集群(三)

資料庫集群主要有主備 主從 分庫 分表等方案。主要用來做儲存高可用,當主庫掛了之後可以利用備庫來代替主庫,備庫不提供任何的訪問能力。問題所在 主備資料同步是有延時的,資料量非常大的情況下可能會達到一分鐘以上。如果這個時候主庫所在伺服器宕機,可能會造成備庫資料不一致的情況。當主庫恢復正常執行之後,是把...