Pandas資料儲存

2021-08-09 02:21:24 字數 2235 閱讀 6614

pandas可以訪問多種介質型別資料,例如:記憶體、文字、csv、json、html、excel、hdf5、sql等

生成資料

import numpy as np 

import pandas as pd

df = pd.dataframe(np.random.randn(1000, 4), columns = ['a', 'b', 'c', 'd'])

df.head()

ab

cd0-0.132774

-2.420509

0.559352

-0.561248

11.114528

0.253100

-0.677942

0.103792

20.979150

0.377479

0.083386

-0.107285

3-0.176661

0.096700

0.841432

0.124089

41.488258

0.209315

0.602946

0.441837

df02 = pd.date_range()
寫入csv

df.to_csv('foo01.csv')
# 不儲存行索引

df.to_csv('foo02.csv', index=false)

讀取csv

read_csv = pd.read_csv('foo02.csv')

read_csv.head()

ab

cd0-0.132774

-2.420509

0.559352

-0.561248

11.114528

0.253100

-0.677942

0.103792

20.979150

0.377479

0.083386

-0.107285

3-0.176661

0.096700

0.841432

0.124089

41.488258

0.209315

0.602946

0.441837

讀取csv其他引數

pd.read_csv(

'foo02.csv', # 檔名

usecols=[0,1,2,4], # 讀取指定列

nrows=5, # 讀取前幾行

encoding='gbk'

# 編碼,根據文字編碼修改,預設utf-8,可以指定為gbk

)

ab

cd0-0.132774

-2.420509

0.559352

nan1

1.114528

0.253100

-0.677942

nan2

0.979150

0.377479

0.083386

nan3

-0.176661

0.096700

0.841432

nan4

1.488258

0.209315

0.602946

nan

x = pd.read_csv(

'foo02.csv',

parse_dates = , # 將兩列合併解析為時間格式

index_col = 'timestamp'

# 將時間設為行索引

)

寫入hdf5

df.to_hdf('foo.h5', 'df')
從hdf5讀取

pd.read_hdf('foo.h5', 'df')

寫入excel檔案

df.to_excel('foo.xlsx', sheet_name='sheet1')
從excel檔案讀取

pd.read_excel('foo.xlsx', 'sheet1', index_col=none, na_values=['na'])

Python之pandas資料載入 儲存

0.輸入與輸出大致可分為三類 0.1 讀取文字檔案和其他更好效的磁碟儲存格式 2.2 使用資料庫中的資料 0.3 利用web api操作網路資源1.讀取文字檔案和其他更好效的磁碟儲存格式pandas提供了一些用於將 型資料讀取為dataframe物件的函式。1.1 pandas中的解析函式 read...

Pandas 資料的讀取,儲存

pandas 如果沒有匯入,匯出的操作,那所有的一切資料處理的操作都將毫無意義。將 資料讀取為dataframe物件的方法,主要有倆個函式,倆者並無不同,以我看,要是讀取以.csv字尾的檔案,就用第乙個。pd.read csv pd.read table 倆個函式引數設定 sep 拆分資料的字串行,...

Python之pandas資料載入 儲存

0.輸入與輸出大致可分為三類 0.1 讀取文字檔案和其他更好效的磁碟儲存格式 2.2 使用資料庫中的資料 0.3 利用web api操作網路資源1.讀取文字檔案和其他更好效的磁碟儲存格式pandas提供了一些用於將 型資料讀取為dataframe物件的函式。1.1 pandas中的解析函式 read...