python的dataframe常用操作

2021-08-20 09:38:30 字數 1553 閱讀 6442

data = dataframe(np.arange(16).reshape(4,4),index = list("abcd"),columns=list('wxyz'))

print data

print data[0:2] #取前兩行資料

print'+++++++++++++'

print len(data ) #求出一共多少行

print data.columns.size #求出一共多少列

print'+++++++++++++'

print data.columns #列索引名稱

print data.index #行索引名稱

print'+++++++++++++'

print data.ix[1] #取第2行資料

print data.iloc[1] #取第2行資料

print'+++++++++++++'

print data['x'] #取列索引為x的一列資料

print data.loc['a'] #取第行索引為」a「的一行資料,

print'+++++++++++++'

print data.loc[:,['x','z'] ] #表示選取所有的行以及columns為a,b的列;

print data.loc[['a','b'],['x','z']] #表示選取'a'和'b'這兩行以及columns為x,z的列的並集;

print'+++++++++++++'

print data.iloc[1:3,1:3] #資料切片操作,切連續的資料塊

print data.iloc[[0,2],[1,2]] #即可以自由選取行位置,和列位置對應的資料,切零散的資料塊

print'+++++++++++++'

print data[data>2] #表示選取資料集中大於0的資料

print data[data.x>5] #表示選取資料集中x這一列大於5的所有的行

print'+++++++++++++'

a1=data.copy()

print a1[a1['y'].isin(['6','10'])] #表顯示滿足條件:列y中的值包含'6','8'的所有行。

print data.mean() #預設對每一列的資料求平均值;若加上引數a.mean(1)則對每一行求平均值;

print data['x'].value_counts() #統計某一列x中各個值出現的次數:

printdata.describe() #對每一列資料進行統計,包括計數,均值,std,各個分位數等。

data.to_excel(r'e:\pypractice\yun\doc\2.xls',sheet_name='sheet1')  #資料輸出至excel

DataFrame學習二 DataFrame的性質

2.1 索引 切片 資料集 data frame2 pd.dataframe data,index one two three four five columns year state pop debt 返回一列資料 frame2 year 返回多列多行 返回兩行 frame2 two three ...

DataFrame學習一 DataFrame的建立

1.1 概要 dataframe是一種 型資料結構,它含有一組有序的列,每列可以是不同的值。dataframe的行索引是index,列索引是columns 建立方式 根據dict進行建立,以及讀取csv或者txt檔案來建立 1.2 字典建立 資料集 data frame pd.dataframe d...

pandas中dict和dataFrame互轉

pd.dataframe dict a 使用df.to dict 缺省會把key和值分開 引數 dict 預設 list series split records index 如果是list dict 這種巢狀情況轉的df,迴轉需要使用records 拿上面的資料舉例,df b a b c 0 0 ...