python下pandas庫的學習

2021-08-14 04:27:16 字數 965 閱讀 9965

python中的pandas模組進行資料分析。

接下來pandas介紹中將學習到如下8塊內容:

1、資料結構簡介:dataframe和series

2、資料索引index

3、利用pandas查詢資料

4、利用pandas的dataframes進行統計分析

5、利用pandas實現sql操作

6、利用pandas進行缺失值的處理

7、利用pandas實現excel的資料透視表功能

8、多層索引的使用

一、資料結構介紹

在pandas中有兩類非常重要的資料結構,即序列series和資料框dataframe。series類似於numpy中的一維陣列,除了通吃一維陣列可用的函式或方法,而且其可通過索引標籤的方式獲取資料,還具有索引的自動對齊功能;dataframe類似於numpy中的二維陣列,同樣可以通用numpy陣列的函式和方法,而且還具有其他靈活應用,後續會介紹到。

1、series的建立

序列的建立主要有三種方式:

1)通過一維陣列建立序列

import numpy as np, pandas as pd

arr1 = np.arange(10)

arr1

type(arr1)

s1 = pd.series(arr1)

s1type(s1)

2)通過字典的方式建立序列

import numpy as np, pandas as pd

arr1 = np.arange(10)

arr1

type(arr1)

s1 = pd.series(arr1)

s1type(s1)

3)通過dataframe中的某一行或某一列建立序列

這部分內容我們放在後面講,因為下面就開始將dataframe的建立。

python的pandas庫讀取csv

首先建立test.csv原始資料,內容如下 時間,地點 一月,北京 二月,上海 三月,廣東 四月,深圳 五月,河南 六月,鄭州 七月,新密 八月,大連 九月,盤錦 十月,瀋陽 十一月,武漢 十二月,南京 匯出pandas import pandas as pd csv pd.read csv tes...

python庫 Pandas學習筆記

food info pandas.read csv 檔名 讀取csv檔案 print type food info 顯示food info的型別,csv檔案的型別是dataframe print food info.dtypes 顯示每一列的特徵儲存的是什麼型別,可以看到在csv檔案中,str型別被...

Python學習 Pandas庫基礎知識

總結完了numpy庫的基礎知識,當然不能少了pandas庫,pd庫是基於numpy的,它有兩種資料形式 series和dataframe。這篇文章總結的都是對dataframe格式的資料進行操作。series的操作和對ndarray格式的操作很像,可以參照numpy的處理方法。它們的不同有乙個博主寫...