pandas 常用函式

2022-08-19 03:24:11 字數 657 閱讀 4351

讀寫csv檔案

寫入 df.to_csv(filename)

讀取 pd.read_csv(filename,header=0) #保留列屬性,header=none不讀列屬性

缺失值處理

去掉包含缺失值的行

df.dropna(how=』any』)

對缺失值進行填充

df.fillna(value=5)

選擇行或列

df.iloc[3] #第四行

df.iloc[:,3] #第四列

df.iloc[3:5,0:2] #第四到六行,第一到三列

df.iloc[[4,5,6],[0,1,2]] #第四到六行,第一到三列

df #這是對行進行切片

統計df.describe() #描述

df.head() #頭五行

df.tail() #尾五行

df.t #轉置

df.sort(columns=』b』)# 對軸進行排序

df.mean() #對每列求均值 通過axis=0/1 確定行列

對映pd.concat(list) #list各元素為各個dateframe

例如 pieces = [df[:3],df[3:6],df[6]];pd.concat(pieces)

原文:

pandas 常用函式

本文翻譯自文章 pandas cheat sheet python for data science 同時新增了部分註解。對於資料科學家,無論是資料分析還是資料探勘來說,pandas是乙個非常重要的python包。它不僅提供了很多方法,使得資料處理非常簡單,同時在資料處理速度上也做了很多優化,使得和...

Pandas常用函式

count 非 na 值的數量 describe 針對 series 或 df 的列計算匯 計 min max 最小值和最大值 argmin argmax 最小值和最大值的索引位置 整數 idxmin idxmax 最小值和最大值的索引值 quantile 樣本分位數 0 到 1 sum求和 mea...

pandas常用函式

pd.read csv filename 從csv檔案匯入資料 pd.read table filename 從限定分隔符的文字檔案匯入資料 pd.read excel filename 從excel檔案匯入資料 pd.read sql query,connection object 從sql表 庫...