(1)pandas 基礎教程

2022-04-23 18:28:55 字數 2473 閱讀 4875

右擊桌面上選擇【open in terminal】 開啟終端。

在彈出的終端中輸入【ipython】進入python的直譯器中,如圖1所示。

圖1 ipython直譯器匯入實驗常用的python包。如圖2所示。

【import pandas as pd】pandas用來做資料處理。

【import numpy as np】numpy用來做高維度矩陣運算.

【import matplotlib.pyplot as plt】matplotlib用來做資料視覺化。

圖2 匯入所需要的包通過傳遞乙個list物件來建立乙個series,pandas會預設建立整型索引,如圖3所示。

【s = pd.series([1,3,5,np.nan,6,8]】將乙個list傳入到series物件

【s】檢視s的值

圖3 建立series物件

通過傳遞乙個 numpy array,時間索引以及列標籤來建立乙個 dataframe,如圖4所示。

【datas = pd.date_range(『20170101』, periods=6)】生成20170101-20170106 六天的日期

【datas】檢視生成的資料

【df = pd.dataframe(np.random.randn(6,4), index=datas, columns=list(『abcd』))】以時間為索引以及abcd為列標籤建立乙個dataframe物件

【df】檢視生成的dataframe物件

圖4 建立dataframe物件

通過傳遞乙個能夠被轉換成類似序列結構的字典物件來建立乙個dataframe。如圖5所示:

【df2 = pd.dataframe()

】生成乙個字典物件,並傳遞生成乙個dataframe

【df2】檢視生成的dataframe

【df2.dtype】檢視不同列的資料型別

圖5 傳遞字典生成dataframe物件檢視 dataframe 中頭部和尾部的行,如圖6所示。

【df.head()】檢視dataframe的前五行

【df.tail(3)】檢視dataframe的後三行

圖6 檢視資料1

檢視df的索引,列名稱和底層的numpy資料,如圖7所示。

【df.index】檢視dataframe的索引。

【df.columns】檢視dataframe的列名稱

【df.values】檢視dataframe底層的資料

圖7 檢視資料2

describe()函式對於資料的快速統計彙總,如圖8所示

【df.describe()】對資料進行快速彙總

圖8 對資料彙總

對資料的轉置,如圖9所示。

【df.t】

圖9 對資料的轉置

對資料的排序,如圖10所示。

【df.sort_index(axis=1, ascending=false)】按軸進行排序

【df.sort_values(by=』b』)】按值進行排序

圖10 對資料的排序對資料的獲取,如圖11所示。

【df[『a』]】選擇乙個單獨的列,返回乙個series

【df[0:3]】切片顯示

【df[『20170101』:』20170103』]】指定日期切片

圖11 對資料的獲取

通過標籤選擇,如圖12所示。

【df.loc[datas[0]]】使用標籤來獲取乙個交叉的區域

【df.loc[『20170102』,[『a』,』b』]]】對於返回物件進行維度縮減

【df.loc[『20170101』:』20170103』,[『a』,』b』]]】標籤切片

【df.loc[『20170102』,[『a』,』b』]]】對於返回物件進行維度縮減

【df.loc[dates[0],』a』]】獲取乙個標量

圖12 通過標籤選擇

通過位置選擇,如圖13所示

【df.iloc[3]】通過傳遞數值進行位置選擇(選擇的是行)

【df.iloc[3:5,0:2]】通過數值進行切片選擇

【df.iloc[[1,2,4],[0,2]]】通過指定乙個位置的列表選擇

【df.iloc[1:3,:]】對行進行切片

【df.iloc[:,1:3]】對列進行切片

【df.iloc[1,1]】獲取特定的值

圖13 通過位置選擇布林索引,如圖14所示。

【df[df.a > 0]】使用乙個單獨列的值來選擇資料

【df[df > 0]】通過where操作選取資料

【df2 = df.copy()】

【df2[『e』] = [『one』, 『one』,』two』,』three』,』four』,』three』]】

【df2】

【df2[df2[『e』].isin([『two』,』four』])]】使用 isin() 方法來過濾

圖14 布林索引

pandas彙總 1 pandas常用函式

函式說明 pd.isnull series pd.notnull series 判斷是否為空 nan 判斷是否不為空 not nan coding utf 8 author 蔚藍的天空tom aim pandas的常用函式的例程 import pandas as pd defpandas manua...

Tensorflow 基礎教程(1)

在使用tensorflow之前先了解下tensorflow的幾個基礎知識 1 使用圖 graph 來表示計算 2 在回話 session 中執行圖 3 使用張量 tensor 來代表資料 4 通過變數 variables 維護狀態 5 通過供給 feeds 和取回 fetches 將資料傳入或傳出任...

Linux基礎教程 1

今天我來寫乙個檔案壓縮和解壓的命令 tar命令和vim編輯器教程 tar命令可以為linux的檔案和目錄建立檔案。利用tar,可以為某一特定檔案建立檔案 備份檔案 也可以在檔案中改變檔案,或者向檔案中加入新的檔案。tar最初被用來在磁帶上建立檔案,現在,使用者可以在任何裝置上建立檔案。利用tar命令...