資料集的讀取

2021-10-07 01:49:49 字數 912 閱讀 9207

建包:

import numpy as np

import pandas as pd

讀取資料:

data = pd.read_csv(r'datingtestset.csv'

,header=

none

)data

效果展示:

5)效果展示:

data.tail(

)data.sample(

)

以上兩個**都是輸出資訊,()裡可以有數字,

區別:data.tail()是輸出末尾5行

data.sample()是隨機輸出一行

data.drop(

'id'

,axis=

1,inplace=

true

)

刪除讀取檔案表頭為「id」的那一列資料,並保證整個檔案還是原來那個

data.duplicated().

any(

)

是檢視資料中是否有重複的值,如果有則輸出true,反之false

data.drop_duplicated(inplace=

true

)

刪除重複的數

pytorch讀取coco資料集

yolov3 an incremental improvement 原理在該篇部落格就寫的很詳細了,這裡就不贅述了 bin bash credit clone coco api git clone cd coco mkdir images cd images download images wget...

Pytorch 讀取大資料集

記錄一下pytorch讀取大型資料集的要點 pytorch 讀取大資料集的一般方法 class mydataset data.dataset def init self,root filepath self.root root init 中讀取檔案路徑而非檔案本體 self.imgs list se...

Python cora資料集的讀取和處理

參考資料 cora資料集介紹 python讀取 圖資料集之cora資料集介紹 用pyton處理 可用於gcn任務 cora資料集由機器學習 組成。這些 分為以下七個類別之一 import numpy as np import pandas as pd 讀入.content檔案 cora conten...