第2章 Python與資料分析

2021-10-21 14:45:29 字數 967 閱讀 8908

《python資料分析基礎教程》學習筆記。

2.1 python資料分析常用的類庫

類庫是用來實現各種功能的類的集合。

-1. numpy

numpy(numerical python)是python科學計算的基礎包,提供以下功能:

-2. pandas

pandas是python資料分析的核心庫,是基於numpy構建的含有複雜資料結構和工具的資料分析包。

pandas圍繞著series(一維序列)和dataframe(二維序列)著兩個核心資料結構展開的。

pandas提供了複雜精細的索引功能,以便快捷地完成重塑、切片、聚合和選取資料子集等操作。

-3. matplotlib

matplotlib是最流行的用於繪製資料圖表的python庫,非常適合建立出版物中的圖表。

-4. scipy

scipy是一組專門用於科學計算的開源python庫,它構建於numpy的基礎之上,提供了乙個用於在python中進行科學計算的工具集。

scipy經常於numpy、pandas、matplotlib和ipython這些核心庫一起使用。

-5. scikit-learn

scikit-learn 是乙個簡單有效的資料探勘和資料分析工具,可供使用者在各種環境下重複使用。是建立在numpy、scipy和matplotlib的基礎上的,對一些常用的演算法進行了封裝。

scikit-learn 的基本功能主要為:

-6. ipython

ipython 是python科學計算標準工具集的組成部分,它為互動式和探索式計算機提供了乙個高效的開發環境。

2.2 jupyter notebook

《精益資料分析》筆記 第5章 資料分析框架

1 戴夫.麥克盧爾 的海盜指標說 麥克盧爾將創業公司最需要關注的指標分為五大類 1 獲取使用者acquisition 2 提高活躍度 activation 3 提高留存率 retention 4 獲取營收 revenue 5 自傳播 referral 這一模型,描述了使用者 客戶 訪客須經歷的五個環...

《利用Python進行資料分析 第2版》第五章筆記

一 pandas兩個主要資料結構 series和dataframe series是一種類似於一維陣列的物件 obj pd.series 4,7,5,3 dataframe既有行索引也有列索引,它可以被看做由series組成的字典 共用同乙個索引 del frame lieming 刪除列 2種方法建...

利用python 進行資料分析 第8章 (1)

繪圖引用 import matplotlib.pyplot as plt matplotlib 的影象都位於figure 物件中。可以用plt.figure 建立乙個新的figure plt.figure plt.figure 有一些選項,特別是figsize,它用於確保當儲存到磁碟時具有一定的大小...