讀《大資料時代》

2021-06-18 05:51:53 字數 1563 閱讀 2167

這兩天把《大資料時代——生活、工作與思維的大變革》讀完了,剛開始是抱著看**的態度閱讀,但讀完之後覺得對自己蠻有啟發,特別是書本中列舉出了一些美國創新型公司應用大資料思維對傳統工作方式的變革,讓人耳目一新。所以我覺得這本書不僅僅適合於計算機專業的人看,各行各業的人都很有必要看看,因為在大資料時代,不用資料說話,是很難把握客戶需求、市場前景和行業發展方向的。

是相關關係,而不是因果關係——在大資料時代,我們必須轉變乙個觀念:在以前,發生任何一件事,人們總是習慣性的去尋找原因試圖來解釋」為什麼」;但現在,在大資料時代,我們能夠找到與一件事情發生相關的許多因素,因此並不是簡單的因果關係才導致了事情的發生,即不是簡單的一一對映關係,而是多重對映,而且這些因素又分別占有不同的權重。這在現實生活當中是很難描述清楚的,作者在書中就強調:我們應該更加注重「是什麼」而不是「為什麼」。

一切皆可量化——隨著感測器、廉價晶元的普及,我們可以花費比以往任何時候都少的代價來獲得資料,把日常生活中一些行為習慣量化成為數字。有個比較典型的例子:日本乙個叫越水重丞的教授,通過在汽車座椅上安裝上百個壓力感測器來監測司機的坐姿習慣,這樣就會產生獨屬於某一人的坐姿資料,從而在下一次判斷乘坐者是否是司機本人,這個系統的識別正確率達到了98%,那麼如果把這項成果應用到汽車的防盜技術和疲勞駕駛提醒上面,我想肯定會很有實用價值。可量化的例子還有很多,最近美國通用電氣提出了乙個叫做工業網際網路的概念,實際上就是想把工業當中傳統的低效率、高消耗的生產方式通過收集資料、分析資料來監測機器的執行狀態,從而及時做出相應的預防措施,提高生產效率。

資料再利用——我們每天都在瀏覽網頁,而且經常被要求輸入驗證碼,發明驗證碼的最初目的是為了判斷使用者是真實的人還是計算機,從而防止惡意的註冊、攻擊等等。但事實上網際網路使用者在識別、輸入驗證碼上面白白花費了太多的時間,簡單算一筆賬:國內網際網路現在5億使用者,平均每人每天花費5秒鐘的時間在驗證碼上面,那麼每天大概就有25億秒的時間花在驗證碼上面,之前有一些網際網路廣告公司,針對驗證碼需要使用者識別、記憶的特點,創造了把輸入驗證碼變成輸入商標這樣的廣告盈利模式;事實上,google很早就開始利用驗證碼了,在google的數字圖書館專案中,利用影象識別技術把數字影象裡的文字翻譯成文字資料,但由於識別技術並達不到100%的準確率,所以部分的資料還需要用肉眼來識別,這時候google想到了利用廣大的網際網路使用者為其服務!是的,它把那些計算機難以識別的文字以驗證碼的方式讓使用者來識別,以國內使用者每天有25億秒的時間花費在驗證碼上、最低小時工資以10元/小時計算,google一年在中國就可以節省25億元的費用,這是乙個多麼驚人的數字!所以說,資料的再利用=無限的商機!

關於商業模式——作者認為,在大資料時代,中等規模的公司將遭受到嚴峻的挑戰。首先,掌握了海量資料的大公司就掌握了主動權,在今後的競爭中能夠立於不敗之地;而小公司雖然手上沒有資料,但由於投入規模、人員數量都很小,因此靈活性很強,同時小規模公司往往以創新思維方式來驅動並且獲利,並不需要很多的生產規模投入,最後還可能被大公司併購等等;相比之下,中等規模的公司掌握的資料沒有大公司多,而且也沒有小公司的靈活性,所以肯定會受到一定程度的打擊。

最後——在資料時代,我們應該更加的注重保護自己個人的隱私資料,因為總會有一雙無形的眼睛時刻盯著你。

5000字 大資料時代讀書筆記 大資料時代讀書筆記

大資料時代讀書筆記 篇一 大資料時代讀書筆記 大資料時代 讀書筆記 一 引論 1.大資料時代的三個轉變 1.隨機取樣 2.不熱衷於精確度 3.不熱衷與尋找因果關係 2.習慣 用來決策的資訊必須是少量而精確的。實際 資料量變大,資料處理速度變快,資料不在精確 3.危險 不是隱私的洩露而是未來行動的預判...

大資料時代

大資料 巨量資料 big data 指的是需要新處理模式才能具有更強的決策力,洞察力和流程優化能力的海量 高增長率和多樣化的資訊資產。4v特點 volume 大量 velocity 高速 variety 多樣 value 價值 資料倉儲,英文名稱為data warehouse,可簡寫為dw或dwh。...

大資料時代

不斷的從 發現這個很具廣告特色的語句,他們總是鼓吹大資料時代的來臨,好像如果你沒抓住他,你就要立馬落後別人好幾條馬路。各種公司企業對他們的產品也宣稱產品是大資料時代不可或缺的科技 乙個錢學森相當於10個王牌師。國內到處充斥著浮躁,不管是大學還是業界,大家都想賺點錢一夜暴富然後過上高富帥的生活。大資料...