Python Pandas庫處理excel表

2021-10-03 15:55:03 字數 1351 閱讀 5576

讀取 / 儲存excel表

data = pandas.read_excel(filepath)

...data.to_excel(filepath, index=none)

# index=none表示不將dataframe的行索引存入excel

讀取dataframe某行/列

# 讀取data中行索引為5-6,列索引為1、3、5的資料

# test的行索引與data的行索引是對應的

test = data.iloc[5:7, [1, 3, 5]]

# 順序讀取行

for item in data.iterrows():

item[0] # 行索引

item[1]['colname'] # 訪問該行對應的資料

# 讀取某列

test = data['colname']

查詢dataframe中符合某條件的元素

# 條件:例如,data['colname'] == a

# test為新dataframe

test = data.loc[data['colname'] == a]

# 或者

test = data[data['colname' == a]]

# 確定dataframe中符合某條件的元素的位置

#方法一,利用numpy

# 返回值a為tuple型別,tuple[0]為行索引,tuple[1]為列索引

a = numpy.where(data == a)

# 方法二

# test為行索引

test = data[data['colname' == a]].index.tolist()

將某列強制轉換型別

# 將某列資料型別由數值型別轉換為字串型別

data['colname'] = data['colname'].astype(str)

根據某列進行排序

data = data.sort_values(['colname'], ascending=false)
更新framedata元素值

data['colname'][index] = a # 會出現 settingwithcopywarning

# 解決方案如下

data.loc[data['colname'][index]] = a

data.loc[data.bidder == 'parakeet2004'] = a

settingwithcopywarning解決方案

Python Pandas庫與資料處理

讀取資料import pandas as pd pd.read csv 觀察資料 print dtypes 每列的資料型別 print head n 前n行資料 print tail n 後n行資料 print columns 每一列的名字 print shape 行列數 print loc 0 索...

Python pandas資料處理

pandas模組 更高階的資料分析工具 基於numpy構建 包含series和dataframe兩種資料結構,以及相應方法 呼叫方法 from pandas import series,dataframe import pandas as pd series 又像陣列又像字典 有序通常是同構的 元素...

python pandas庫具體用法

一 學習資料探勘,如果是用python的話,必須掌握好科學計算的相關庫,我先學習了pandas的一些具體操作 encoding utf 8 import numpy as np import os import pylab as pl import pandas as pd from pandas ...