決戰大資料摘錄

2021-09-02 13:33:39 字數 3577 閱讀 3201

第一部分  從資料化運營到運營資料

1、大資料,為什麼很多人只會談,不會做

(1)大資料的經典定義4v:海量的資料規模(volume)、快速的資料流轉和動態的資料體系(velocity)、

多樣的資料型別(variety)和巨大的資料價值(value)。

(2) 斷層是大資料所面臨的嚴重問題,收集資料的人不知道將來的人怎麼使用資料,建立模型的人也不

知道自己所採用的資料在未來是否穩定,使用模型的人也不知道整個資料的來路或加工過程。

2、大資料的本質是還原使用者的真實需求

(1)識別,讓似是而非的行為資料串聯起來,企業有多大的能力去識別乙個「碎片化了的個人」,是否

知道使用者是誰,決定了企業資料收集行為的意義大小。

(2)資料收集的價值包含兩個維度。一是企業價值,衡量這個資料對企業產生的價值,實現的是企業資

源的合理分配。二是客戶價值,衡量這個資料對顧客的價值,如何幫助企業為客戶提供更好的服務,

實現的是顧客體驗的提公升。

(3)如何更好地識別各個裝置的使用者是否為同乙個人,如何更好地理解使用者在各個不同場景下表現出

來的不同需求,如何更好地理解資料融合後產生的價值,將是未來商業中每乙個企業都必須考慮的問題。

3、「活」的資料才是大資料

(1)「死」資料就是單純儲存在資料庫中,無法進行分析和使用,並且不能夠產生價值的資料。

(2) 「活」做資料收集,就是企業不要侷限於只收集自己使用者產生的資料,還要把「別人」的資料收集

過來進行綜合分析。

(3)「活」看資料指標,就是指企業不要侷限於已有的資料框架,而應該結合使用者需求的不同場景來

靈活應用收集到的「活」資料。

4、無線資料,大資料的顛覆者

(1)保證pc和無線兩份數的完整,通過使用者體系將兩份資料關聯起來,就可以在分析的時候用彼此的

融合來還原使用者的行為。

(2)面對無線資料, 要解決的兩個問題:一是做到高效準確的收集,二是培養資料分析師的多屏思維。

5、資料分類與資料價值,什麼才是你的核心資料

(1)資料分類的4大維度:按照是否可以再生的標準來看,可以分為不可再生資料和可再生資料。按照

資料所處的儲存層次來看,可以分為基礎層、中間層和應用層。按照資料業務歸屬來看,可以分為各個

資料主體。按照是否為隱私來區分,可以分為隱私資料和非隱私資料。

(2)資料的5大價值:一、識別與串聯價值,在資訊多元化的時代,單純運用cookie來識別使用者行為的

方式已經過時,能夠辨別關係和身份的資料是最重要的,應該是有多少存多少,永遠不要放棄。

二、描述價值,可以用來刻畫研究物件,描述資料不是越多越好,而是應該收集和業務緊密相關的資料,

在複雜的資料中抽象出核心的點,分析資料的框架。三、時間價值,除了體現歷史的資料之外,還有乙個

價值是「即時」,對使用者的現實場景進行即時資料推送。四、**價值,能夠對公司整體的經營策略及

未來的預判產生非常大的影響。五、產出資料的價值,很多資料本身並沒有特別的含義,但是在幾個資料

組合在一起或者對部分資料進行整合之後就產生了新的價值,比如商品的評價資料。

6、從用資料到養資料

(1)大資料背景下,必須考慮資料之間的關聯性。乙個單獨的資料是沒有意義的,要把資料放在乙個

「資料框架」(場景)之中,才能看出存在的問題。

(2)養資料通常有兩類,一類是**自身沒有的資料,需要使用者主動提供的;另一類是公司擁有的,

但沒有進行收集的資料。

(3)「用資料」更多的是一種方**,而「養資料」則是一種資料戰略,是基於深入業務理解的更高

層次的商業決策。

(4)我們做的很多決策都是yes或no,在面對或選擇的時候,我們更容易被慣性牽絆,很多時候,我們

需要遠離「或」的概念,要打破侷限,不要把自己封閉在狹隘的思想中,才不會被困住而渾然不覺。

7、資料的盲點,負面資料的力量

(1)在資料中,盲點可以分為二類:一類是物理盲點,指在資料庫中不存在這樣的資料,即企業沒有收集

到應該收集的資料,另一類是邏輯盲點,指有資料但是沒有被很好的挖掘出來,很多時候與資料分析師

或者資料使用者的經驗和敏感度有關係。

(2)面對資料盲點,正能量思考告訴你怎麼做可以達到成功的終點,負能量思考則告訴你怎麼做才不會

失敗。當失敗的代價越大、風險越高時,高風險能讓乙個人對不可**性非常敏感,那時候的負能量思考

和避風險能力就自然而然地出現了。

(3)是否看到資料盲點價值的核心是,有沒有看到應該看到的資料,有沒有錯失不應該錯失的資料。

第二部分 阿里巴巴的大資料秘密

8、阿里巴巴的大資料實踐

(1)「先開槍,後瞄準」,對於創業公司來說,管理者不需要把眼光放得過於長遠。如果從短期目標出

發,在不斷的觀察之中發現問題,並且解決問題,很可能會更容易獲得成功。

9、混、通、曬,阿里巴巴資料化運營的內三板斧

(1)混,混出資料,只有具備商業敏感的資料分析師,才會懂得使用什麼資料來驅動公司實現經營

目標。資料部的人要和業務部的人經常「混」在一起。

(2)通,打「通」「混」的資料,知道帶著業務問題來看資料或者帶著資料來看業務,把資料打通,

一是商業理解和資料之間的「通」,另一種就是部門資料和部門資料的交叉。

(3)曬,是一種在「混」和「通」的基礎上產生出來的最終的資料表現,是基於人、商業和資料結合

後的一種看資料和用資料的方**。通過業務和資料的結合,將資料「曬」出來,創造出新的商業價值。

(4)思考,要學會關視窗,「關視窗」在計算機世界中很容易執行,關掉多餘的視窗可大大減輕電腦的

執行負擔。現實工作中,也不要將有限的思考資源浪費在不能產生價值的思考上面,將更多的時間留下來

做更有價值的決策。

10、存、管、用、阿里巴巴運營資料的外三板斧

(1)存,資料收集的開始,收集資料不是目的,讓收集起來的資料如何產生價值才是最終的目的。

(2)管,保護好儲存資料,學會用資料產品來解決獲取及使用資料的問題。

(3)用,從收集資料到管理資料,在「用」資料的問題上,資料的**和重組,都能做到顛覆性創新。

第一步,建立使用者的標籤。1、通過業務規則結合資料分析來建立標籤。2、通過模型來建立標籤。

3、通過模型的組合來生成新的標籤。

第二步,標籤的應用。最核心的就是資料中間層和前台業務層的對接,讓資料從成本轉化成利潤,

才能真正發揮出大資料的價值。

(4)用化骨綿掌解決本質問題,一方面,要找到本質問題,就需要我們在思考時排除過多的東西,

使我們能夠更好地集中精力去解決重要的問題;另一方面,我們要有方法去發現本質問題,不斷地用

邏輯方法將問題進行分解,直到不能分解為止,然後從根本處去解決這個問題。

11、大資料,未來商業的利器

(1)大資料價值的體現,在於資料與資料的連線。重要的是資料和資料之間的關係,而不是資料本身。

(2)資料的標籤化管理,是乙個非常重要的趨勢。資料的屬性標籤是人類經驗判斷的資料,是資料後的資料。

(3)未來是人機的結合體,人和機器的結合,或者人和資料的結合將是未來的一種進步模式,人類將通過

資料變得更加智慧型。未來人類身上流動著的是血液以及資料。我們要學會人機分工,讓人做人最擅長的

事情,讓機器做機器最擅長的事情。

12、其它

新未來,決戰支付大資料

資料的價值,不僅僅體現在使用者畫像,更是業務提公升的重要依據,更能顛覆整個業務銷售和營銷的形勢。在大資料時代,資料是最好的營銷幫手。通過後台的資料處理系統輸出實時資料包表對於商戶的經營提供而來很大的便利。對於支付使用者,他們喜歡什麼?作為企業和開發者的你知道嗎?付費使用者習慣 付費時段 付費高峰等資...

《決戰大資料(公升級版) 大資料的關鍵思考》讀後感

這是一本車品覺先生在電商領域多年大資料 資料分析的實戰經驗總結,可以說是資料系統頂層設計的精髓,這本書通篇全是幹活,乾到從閱讀前言起,就需要不斷地思考,二十萬字的一本書,前前後後讀了乙個月才讀完,幾乎每頁都要做筆記寫思考結果,每頁都有值得反覆琢磨的點,推薦每位工作中涉及大資料 資料分析工作的人都應該...

資料庫摘錄

如果這些資訊都存在一張表中,上面的問題可以迎刃而解。比如這樣 c id,c title,c authors,c publish,c price,c discount,c score,c comment count 但是這種db設計是不可接受的。原因有很多 單條記錄過長,db效率低 模組耦合度大,所有...