Pandas 如何提取 拆分csv檔案中的指定列

2021-10-24 23:11:58 字數 1395 閱讀 8451

在機器學習中,有時會需要將資料集的某個特徵或多個特徵提取出來,以便進行訓練或對比,下面記錄一種拆分csv檔案中列(一般為特徵)的方法。

'''

以下**實現功能包括:

1.將'train.csv'檔案中的'id'、'saleprice'特徵提取到'train_price.csv'

2.將'train.csv'檔案中除'saleprice'的特徵(包括'id'特徵)提取到'train_no_price.csv'

''''''

此**用到的'train.csv'為某地區房屋基本資訊及銷售資訊等,為方便學習,此檔案全部內容已分享在文章末尾

'''import pandas as pd

train = pd.read_csv(

'train.csv'

)#讀取訓練集

train.iloc[:,

:].to_csv(

'train_price.csv'

, mode =

'w',

index_label =

'id'

, index =

none

#不新增新索引,若此處不設為none,會自動生成一列從0開始的索引

)#將'train.csv'複製到'train_price.csv'

train_price = pd.read_csv(

'train_price.csv'

)train_price.drop(train_price.iloc[:,

1:-1

],axis =1,

inplace=

true

#對原始物件進行修改

)#刪除特徵'id'及'saleprice'以外的所有特徵

train_price.iloc[:,

:].to_csv(

'train_price.csv'

, mode =

'w',

index_label =

'id'

, header =

true

, index =

none

)#以只包含'id'及'saleprice'特徵的csv檔案覆蓋原檔案

train.iloc[:,

0:-1

].to_csv(

'train_no_price.csv'

, mode =

'w',

index_label =

'id'

, header =

true

, index =

none

)#將'train.csv'檔案中除'saleprice'的特徵(包括'id'特徵)提取

CSV檔案拆分 行拆分

先要把csv文件儲存為utf 8格式 import os.path import osimport csvimport rewith open email.csv w newline encoding utf 8 as csvfile writer csv.writer csvfile with o...

Pandas讀取csv時如何設定列名

1.csv檔案自帶列標題 import pandas as pd df example pd.read csv pandas example read.csv 等同於 df example pd.read csv pandas example read.csv header 0 2.csv檔案有列標...

pandas如何提取指定行列的值

首先讀一下excel檔案,看一下資料長什麼樣子 import pandas as pd import numpy as np citydata pd.read excel c users xujinhua desktop test city.xlsx header none 如果上面不寫header...