《大資料日知錄 架構與演算法》試讀 隨想

2021-06-26 16:09:26 字數 600 閱讀 2983

隨想一:大資料是什麼?

做為一位技術人員,如果有人問我,大資料是什麼我該如何解答?

1.現在你去蘇寧購物,蘇寧每天上萬的**量,蘇寧**提供免費的wifi,乙個月下來有幾十萬的**量,一年有上百萬的**量,這些流量背後就是活生生的資料,這些由量拼成的資料就是大資料.

隨想二:大資料有什麼價值呢?拿上面的例子來說.

1.蘇寧會找專門分析資料的公司來挖掘這些資料的潛在價值.打個比方來說

a.通過wifi使用熱度,可以分析使用者在哪些區域活躍度比較高,這些活躍度高的地方商用價值也相對應的體現(租金,活動價值比較高)

b.哪些使用者通過wifi 使用網上支付.使用的哪種支付方式,為下步的商業洽談做準備.

c.每天什麼時間段**量最多?什麼時候支付成交率最高?通過wifi分析鏈結的手機型號,規格來推斷顧客的消費水準. 2.

隨想三:《大資料日知錄:架構與演算法》感想

大資料的未來需要有人來落地實施,這個責任自然落到了程式設計行業那一類人身上,如何架構,如何實現還要很長的路要走.

資料的增長這幾年可以成幾何的形式增長.我們的架構能跟的上嗎?書中所講tao的架構那是facebook的圖資料庫,比較創新的做法.

對於未來不可知.我們攜手創造.

《大資料日知錄 架構與演算法》前言

大資料日知錄 架構與演算法 前言 像移動網際網路 o2o 可穿戴裝置等概念一樣,大資料 從甫一提出到颶風般席捲並風靡全球,從最初的技術名詞到形成滲透各行各業的社會現象,所耗時間僅幾年而已,其興也勃焉。那麼,大資料是否會像很多曾經火熱現在已難覓蹤跡的流行概念一樣,將來某日,人們靜心抬眼,發現風已去而水...

大資料日知錄(一)資料分片與路由

概念 目前主流的大資料儲存與計算系統通常採用橫向擴充套件 scale out 的方式支援系統可擴充套件性,即通過增加機器數目來獲得水平擴充套件能力。對於待儲存處理的海量資料,需要通過資料分片 shard partition 來將資料進行切分並分配到各個機器中去,資料分片後如何找到某條記錄的儲存位置就...

必知C 演算法之大資料相關基本內容

map reduce和hadoop熱門 常見海量處理題目解題關鍵 1.分而治之。通過雜湊函式將大任務分流到機器,或分流成小檔案 2.常用的hashmap或bitmap 難點 通訊,時間和空間的估算。請對10億個ipv4的ip位址進行排序,每個ip只會出現一次 ipv4的ip數量約等於42億 ip 轉...