大資料技術全解之曹沖稱象與大資料思想

2021-06-21 04:50:35 字數 1015 閱讀 3266

有一次,吳國孫權送給曹操一頭大象。大象運到許昌那天,曹操帶領文武百官和小兒子曹沖一同去看。曹操的人都沒有見過大象。這頭大象又高又大,光說腿就有大殿的柱子那麼粗,人走近去比一比,還碰不到它的肚子。

大臣a說:「只有造一桿頂大的秤來稱。」

大臣b說:「這可要造多大的一桿秤呀!再說,大象是活的,也沒辦法稱呀!我看只有把它宰了,切成塊兒稱。」他的話剛說完,所有的人都哈哈大笑起來。

這時曹操最心愛的兒子曹沖說:「爸爸,我有個法兒可以稱大象。」曹操笑著說:「你小小年紀,有什麼法子?你倒說說,看有沒有道理。」曹沖把辦法說了,曹操一聽連連叫好,吩咐左右立刻準備稱象,然後對大臣們說:「走!咱們到河邊看稱象去!」

眾大臣跟隨曹操來到河邊。河裡停著一艘大船,曹沖叫人把象牽到船上,等船身穩定了,在船舷上齊水面的地方刻了一條道道。再叫人把象牽到岸上來,把大大小小的石頭一塊一塊地往船上裝,船身就一點兒一點兒往下沉。等船身沉到剛才刻的那條道道和水面一樣齊了,曹沖就叫人停止裝石頭。

大臣們睜大了眼睛,起先還摸不清是怎麼回事,看到這裡不由得連聲稱讚:「好辦法!好辦法!」現在誰都明白,只要把船裡的石頭都稱一下,把重量加起來,就知道象有多重了。

曹沖稱象的示意圖:

這個故事告訴人們工具(秤)的處理能力有限,當超出其能力範圍之後,應當如何處理?是造更大的工具(超級的大秤),還是採用智慧型將人們要稱的物(大象)用多個拆分的物(石塊)組成與要稱的物對等的組合物?「分而治之」是處理大事物的解決之道,只需將這個大事物分解到小工具能處理的大小,複製更多的小工具來同時處理,最後將每乙個部分的結果彙總起來,就是對大事物的處理結果。

————本文節選自《大資料技術全解:基礎、設計、開發與實踐》,楊巨龍 編,電子工業出版社

大資料技術全解之二

大資料技術全解 國內首本講清大資料系統研發全流程圖書,作者是乙個我敬佩的人,敢於做非常具有挑戰性的工作。寫書本來不是乙個容易的事情,寫一本關於最新的技術的書,更加的不容易。除了作者自身需要有很高的技術造詣,對書中相關的技術理解足夠深外,還需要作者能夠有很強的表達能力和說服能力,把最新的技術的奧秘清晰...

大資料全系技術概覽

大資料 big data 指無法在一定時間範圍內用常規軟體工具進行捕捉 管理和處理的資料集合,是需要新處理模式才能具有更強的決策力 洞察發現力和流程優化能力的海量 高增長率和多樣化的資訊資產。在維克托 邁爾 捨恩伯格及肯尼斯 庫克耶編寫的 大資料時代 中大資料指不用隨機分析法 抽樣調查 這樣捷徑,而...

大資料技術之kylin tableau

kylin tableau hive 就是字面意思,大型資料倉儲,這邊用了乙個叫kylin 的東西 從hive 取資料生成cube 以key value 的方式存在hbase 裡面 hbase 對接tableau 等報表工具 hbase 中 cube 存的是 每個緯度的資訊 下圖是有四個緯度夠成的c...