《利用Python進行資料分析》Chapter 1

2021-10-02 20:00:19 字數 655 閱讀 5786

本章內容為全書學習的準備工作,主要介紹了一下部分內容。

1. 資料的型別

**型資料

多維陣列(矩陣)

相關聯的多張表(主鍵和外來鍵)

時間序列

2. python進行資料分析的優缺點

解釋型語言、膠水語言

效率低全域性直譯器鎖(gil)

3. 重要的python庫(資料科學相關)

numpy

描述待補充。下同。

pandas

matplotlib

ipython和jupyter

scipy

scikit_learn

statsmodels

4. 安裝與設定

安裝與更新

pip包管理工具

pip install package_name

pip install --upgrade package_name

conda包管理

conda install package_name

conda update package_name

5. 相關術語

偽**用一種類似**的結構形式來描述思路(演算法或者過程或者邏輯),事實上並不是有效的源**。

語法糖一些**的便利寫法,沒有新的功能,但可以簡化**結構。

利用python進行資料分析

目錄 10 minutes to pandas 翻譯 pandas中loc iloc ix的區別 pandas dropna函式 pandas中dataframe的stack unstack 和pivot 方法的對比 pandas中關於set index和reset index的用法 python匿...

利用python進行資料分析

利用python進行資料分析,需要了解一些基本的方法,比如掌握回歸分析的方法,通過線性回歸和邏輯回歸,其實你就可以對大多數的資料進行回歸分析,並得出相對精確地結論。這部分需要掌握的知識點如下 回歸分析 線性回歸 邏輯回歸 基本的分類演算法 決策樹 隨機森林 樸素貝葉斯 基本的聚類演算法 k mean...

《利用Python進行資料分析》筆記

之前的筆記一直記在我的印象筆記上,今天突然想到 不如直接記在部落格上,印象筆記只記錄生活上的事,這樣也分工明確一些。同時也能和大家分享,也許可以幫助到別人。由於這個學習筆記系列主要還是用於個人學習總結用,所以會比較凌亂,望大家理解!2017 9 23 p151 pd.dropna thresh 其中...