《大資料時代》讀後

2021-08-10 05:13:34 字數 1392 閱讀 1470

前段時間有朋友聊天,說道他們mba的課後作業是《大資料時代》讀後感,想起這本書幾年前讀過,總結一篇我的讀後感。

--------------

提到《大資料時代》,很多人都說這是一場思維革命,讓人能處於更大的乙個視角來看問題,本書的主要觀點是這三點:

1.要全體不要抽樣,在大資料時代,是有能力儲存並處理全量資料的。

2.要效率不要絕對精確,對於單個個體,大資料**不到絕對精確,但是多個數量的總體來看,結果是可以符合期望的。

3.要相關不要因果,僅僅說明各個資料項和某個結果有關聯,深層次的原因或者理論,則不需要考慮。

它的論據主要有谷歌的流感**,微博的推送,電商平台的商品推薦,以及各種**的「為你推薦」等功能。拿流感**來說,谷歌確實**到了流感爆發的地點,這對衛生安全方面是有積極的影響。我從微博推送,電商的商品推薦的使用體驗來說,卻總感覺不太對勁,並沒有完全滿足我的口味,這個就是不要絕對精確的體驗,所以,我也在想,本書中所提到的三點,是否能滿足需要,是否完美了嗎?

首先說要全體不要抽樣,大資料需要獲得全部資料,在歷史資料中先找到和目標結果相關的資料,記錄這些資料的特徵,以後根據這些特徵來**結果。這裡會有問題,全部資訊是乙個比較理想的情況,現實情況是不可能有全部資訊,谷歌在計算流感資料的時候,有考慮南美洲的乙隻蝴蝶扇了下翅膀嗎?如果沒有考慮,能確保這只蝴蝶不影響到結果嗎?所以,資料的邊界是無法界定的,也不可能是全部參與計算的。

其次說要效率不要絕對精確,原本以為只是對單個個體的不精確,但是後來發現,對於整體的結果,這個大資料也不是精確的,它計算出來的是某乙個事件發生的概率,而且這概率不可能是100%。當然,人們也能接受相對的精確,這只是乙個小瑕疵。

最後說要相關不要因果,通過對流感事件在發生前後,所有的相關因素進行整理,對比幾次之後,大資料獲得了它的資料特徵,在將來如果有資料和該特徵匹配了,那麼就可以**該事件會再次發生。那麼來說,大資料只能**歷史事件了?對於以前沒發生過的事,大資料就沒辦法處理了,即便是歷史上發生過的事,也因為環境不斷變化,所相關的特徵也會有所變化,所以,在快速發展的當今社會,大資料的作用會很有限。

這讓我想起了傳統醫學,不僅僅是漢醫,藏藥,甚至在現在非洲的某些部落,在生病或受傷時也會吃草藥。每種藥草都包含了上千種化學物質,比例也各不相同,這相當於全部資料;中醫知道黃連可以瀉火,但是不知道是黃連裡的哪種物質的功效(中醫裡的陰陽五行等理論,我認為並非能說明黃連和瀉火的因果關係),這和要相關不要因果一樣。對於新產生的疾病就無法**,比如網癮該吃哪些中草藥呢?我們應該都記得在西醫傳入以前,中醫是無法**肺結核,甚至還開出了了「人血饅頭」這樣的藥方。

所以大資料時代並非未來,而是乙個對大資料處理的乙個初級階段,他所能處理的問題有限,總會有不確定因素,歷史總會變化,資料也一直在變化。找不到因果關係時,人類會陷入大資料的海洋中無法上岸。

《大資料時代》讀後感(一)

1.很多大資料的應用都是做 比如google的flu target公司對懷孕婦女的 電商 上越來越精準的推薦也是一種 2.當資料變得容易採集,當可採集的資料量大到一定規模,當大資料量的計算能力大大提高,感覺確實很多過去做不了的事情可以做了,原來的一些思維要被打破 3.當然大資料並不意味著不要資料的精...

大資料時代

大資料 巨量資料 big data 指的是需要新處理模式才能具有更強的決策力,洞察力和流程優化能力的海量 高增長率和多樣化的資訊資產。4v特點 volume 大量 velocity 高速 variety 多樣 value 價值 資料倉儲,英文名稱為data warehouse,可簡寫為dw或dwh。...

大資料時代

不斷的從 發現這個很具廣告特色的語句,他們總是鼓吹大資料時代的來臨,好像如果你沒抓住他,你就要立馬落後別人好幾條馬路。各種公司企業對他們的產品也宣稱產品是大資料時代不可或缺的科技 乙個錢學森相當於10個王牌師。國內到處充斥著浮躁,不管是大學還是業界,大家都想賺點錢一夜暴富然後過上高富帥的生活。大資料...