《深入淺出資料分析》讀書筆記

2021-09-11 03:23:07 字數 1799 閱讀 6394

寒假看了一本資料分析的啟蒙書籍叫《深入淺出資料分析》,這本書插圖很多,主要是通過舉實際例子來介紹資料分析的各種方法,非常通俗易懂。下面分享當時的讀書筆記(內容不多,覺得重要的才記下來~)。
第一章 資料分析引言:分解資料

1、資料分析的固定基本流程:

確定—>分解—>評估—>決策

確定:第一步是了解問題(從你的客戶了解)再確定問題。

分解:分解問題和資料使其成為更小的組成部分。

評估:對了解到的情況作出結論。

決策:作出乙個決策(建議)來。

第二章 實驗:檢驗你的理論

1、統計與分析最基本的原理之一是比較法。

2、通過拆分資料塊來管理混雜因素。

3、好的實驗總有乙個控制組(對照組)。

4、控制組:一組體現現狀的處理物件,未經任何新處理。

5、觀察研究法:被研究的人字自行決定自己屬於哪個群體的一種研究方法。

第三章 最優化:尋找最大值

1、決策變數就是你能控制的因素,同時它受約束條件的限制。

2、用電子**實現最優化,比如excel裡的solver求解器。

第四章 資料圖形化

1、利用散點圖進行探索性資料分析。

第五章 假設檢驗

1、偽證:不是選出最合理的假設,而是剔除無法證實的假設。

2、假設檢驗的核心是偽證。

3、診斷性是證據所具有的一種功能,能夠幫助你評價所考慮的假設的相對似然。

第六章 貝葉斯統計

1、條件概率記法:p ( l | + )

2、基礎概率又稱作事前概率。

第七章 主觀概率

1、用乙個數字形式的概率來表示自己對某事的確認程度,所用的就是主觀概率。

2、使用貝葉斯規則求主觀概率的根本在於找出在假設成立的條件下,證據出現的概率。

第八章 啟發法

1、選取一兩個變數,然後根據這些變數對整個系統做出結論,這就是在使用啟發法。

2、啟發法:1(心理學定義)用一種更便於理解的屬性代替一種難理解的、令人困惑的屬性。2(電腦科學定義)一種解決問題的方法,可能會得出正確答案,但不保證得出最優答案。

第九、十章 略

第十一章 誤差

1、機會誤差又稱殘差、均方根誤差

第十二章 關聯式資料庫

2、關聯式資料庫管理系統(rdbms)是最重要最有效的資料管理方法之一。

3、sql是結構化查詢語言,是一種關聯式資料庫檢索方法。

第十三章 整理資料

1、substitute:以指定的新文字替代單元格中不需要的文字。

value:求以文字格式儲存的數字的數值。

conc atenate:取兩個值,然後合併在一起len:求單元格的長度。

trim:刪除單元格中的空格。

right:取單元格右邊的字元。

left:取單元格左邊的字元。

find:告訴你在單元格中的哪個位置查詢搜尋字串。

2、r用正規表示式處理複雜的資料模式。

3、正規表示式是一種程式設計工具,可以用這個工具指定複雜的模式以便匹配和替換文字字串。

4、\ ( . * \ )

左括號:反斜槓為退出符,告訴r括號本身不是r表示式。

句點:代表任何字元。

星號:代表任何數目的前面字元。

深入淺出資料分析 讀書筆記

本書是說明類的型別,主要內容是告訴我們該如何做資料分析。主要從一下幾個方面進行闡述 確定問題 分解問題 將乙個大問題分解為幾個小問題 評估 對每個問題使用資料評估 決策 迴圈執行這四個過程 驗證理論需要進行實驗對比,檢驗理論 要注意對照組的設定 列出各種可能。利用證據排所有的不可能的假設。證偽法。排...

《深入淺出資料分析》讀書筆記

最近看了head first系列,重讀了 深入淺出資料分析 發現這是一本很好的書,在思維上開闊的不錯,通過案例培養資料思維,把思路講的很清楚,現總結筆記如下 一 資料分析引言 分解資料 1 確定 分解 評估 決策 重在如何將乙個大問題分解成若干易行的小問題,將手頭的資料彙總為有用的格式。2 心智模型...

讀書筆記 《深入淺出資料分析》讀書筆記

這本書呢它在每一章都安排了乙個企業問題,以解決乙個問題的形式去穿插知識點以及分析思路,可以快速掃讀了解一下分析思路還有思考一下課後問題。之前看見有些人推薦這本書,我才去看的,但是我並不推薦這本書,書裡的內容過於簡單,而且裡面的工具操作都落後了。確定問題 分解問題 將問題分解為更小的組塊 基準假設 評...