Python資料處理常用程式模組彙總

2021-09-24 20:53:33 字數 816 閱讀 4945

本文主要將日後工作中常用到的一些簡短程式塊記錄下來,以便可以快速更改進行適配,諸如資料讀取程式,遍歷程式等

csv將是工作中最常見到的一種資料格式,這裡主要介紹兩種方法讀取csv並遍歷每一行的csv資料

python中有自帶的處理csv資料的包,可以通過import csv匯入使用,下面通過乙個例子進行簡要介紹:test.cst中由兩列構成,且每一列都沒有列名,通過csv.reader方法讀取後返回的是乙個迭代器dics,如果想遍歷每一行資料,直接使用for迴圈進行比那裡

import csv

path = r'i:/test.csv'

dics = csv.reader(open(path, 'r', encoding='utf-8'))

for row in dics:

print(row[0],row[1])

做資料相關工作少不了pandas模組,pandas中有read_csv方法讀取csv,可以預設將第一行的每一列作為列名,也可以通過name引數設定列名;進行遍歷時,可以使用data.rows得到乙個迭代器,使用和1.1中相同的方法進行遍歷,還可以使用data.iterrows(),其中有index(行名)和row(每一行的資料)兩個可迭代變數,row是字典形式的。

import pandas as pd

data = pd.read_csv(path, names=['name1','name2'])

for index,row1 in data.iterrows():

print(row1['name'],row1['label'])

Python 常用資料處理

以下為積累 python 常用資料處理方法,不定時更新。1.遍歷某資料夾下所有檔案 files os.listdir path 2.取消科學計數法 np.set printoptions suppress true df a astype int64 3.判斷 dataframe 為空 全部資料集 ...

資料處理常用

1,dataframe獲取列名稱 dataframe.columns.values.tolist 2,dataframe轉化為numpy dataframe.values 轉化為陣列後可以進行數值計算 3,numpy轉化為列表 list numpy.tolist 4,進行陣列運算時如果有字串 nul...

Python資料處理pandas常用方法

1 時間序列化 periodindex 2 變更列名 rename df.rename columns inplace true 3 對某列執行特定函式 agg df.groupby 貨主 英文列名.agg sum mean max min 4 排序 sort values ascending如果都...