利用python對CSV檔案分組並拆分檔案

2021-08-21 04:47:04 字數 892 閱讀 4027

指令碼背景:提取了不同類別下的購買手機號碼,由於資料量巨大,需要對資料進行分組,得到不同類別下的手機號碼,同時自動拆分檔案,按照乙個特定類別輸出檔案。

import pandas as pd
#read data from csv

df=pd.read_csv('c:\\users\\administrator\\documents\\haomabao.csv',sep=',',engine='python',header=[1,2])

#get the columns of df

df.columns=['telephone','cc']

c=list(df.columns)

print(c[1:2])

grouped=df.groupby(c[1:2]) #according different categories to group by the df
#delete duplicated data 

ind_frame=df.drop_duplicates(subset=['cc'], keep='first')

print(ind_frame.cc)

print(range(len(ind_frame)))

for name in ind_frame.cc:

print(name)

df[df.cc==name].to_csv("f:\\result\\_"+u"%s" %name+".csv")

最後可以得到不同類別下的號碼,並且每乙個類別對應乙個類別名稱的csv檔案。此方法可舉一反三應用在別的資料上。

利用python對csv檔案進行分割

有個任務,就是將乙個大的csv分割為幾個小的csv,當然是的包含表頭的。於是,我想到了類似於,用雙指標來做。import csv import os path users mac desktop 186 3.csv with open path,r newline as file csvreader...

利用Python處理CSV 檔案

csv 檔案 將資料作為一系列以逗號分隔的值寫入檔案,通俗的講就是兩個逗號的資訊之間看作乙個資料。csv模組包含在python標準庫中,可用於分析csv檔案中的資料行 import csv 利用matplotlib繪圖 from matplotlib import pyplot as plt fil...

python中利用CSV庫讀寫csv檔案

csv檔案 逗號分隔值 comma separated values,csv,有時也稱為字元分隔值,因為分隔字元也可以不是逗號 其檔案以純文字形式儲存 資料 數字和文字 首先我們先 看一下資料 我們建立了兩個csv檔案,乙個是英文的,乙個是帶有中文的 需要加上,encoding utf 8 不然會有...