Pandas資料儲存

pandas可以訪問多種介質型別資料，例如：記憶體、文字、csv、json、html、excel、hdf5、sql等

生成資料

import numpy as np 
import pandas as pd
df = pd.dataframe(np.random.randn(1000, 4), columns = ['a', 'b', 'c', 'd'])
df.head()

cd0-0.132774

-2.420509

0.559352

-0.561248

11.114528

0.253100

-0.677942

0.103792

20.979150

0.377479

0.083386

-0.107285

3-0.176661

0.096700

0.841432

0.124089

41.488258

0.209315

0.602946

0.441837

df02 = pd.date_range()

寫入csv

df.to_csv('foo01.csv')

# 不儲存行索引
df.to_csv('foo02.csv', index=false)

讀取csv

read_csv = pd.read_csv('foo02.csv')
read_csv.head()

cd0-0.132774

-2.420509

0.559352

-0.561248

11.114528

0.253100

-0.677942

0.103792

20.979150

0.377479

0.083386

-0.107285

3-0.176661

0.096700

0.841432

0.124089

41.488258

0.209315

0.602946

0.441837

讀取csv其他引數

pd.read_csv(
'foo02.csv', # 檔名
usecols=[0,1,2,4], # 讀取指定列
nrows=5, # 讀取前幾行
encoding='gbk'
# 編碼，根據文字編碼修改，預設utf-8,可以指定為gbk
)

cd0-0.132774

-2.420509

0.559352

nan1

1.114528

0.253100

-0.677942

nan2

0.979150

0.377479

0.083386

nan3

-0.176661

0.096700

0.841432

nan4

1.488258

0.209315

0.602946

nan

x = pd.read_csv(
'foo02.csv',
parse_dates = , # 將兩列合併解析為時間格式
index_col = 'timestamp'
# 將時間設為行索引
)

寫入hdf5

df.to_hdf('foo.h5', 'df')

從hdf5讀取

pd.read_hdf('foo.h5', 'df')

寫入excel檔案

df.to_excel('foo.xlsx', sheet_name='sheet1')

從excel檔案讀取

pd.read_excel('foo.xlsx', 'sheet1', index_col=none, na_values=['na'])

Python之pandas資料載入儲存

0.輸入與輸出大致可分為三類 0.1 讀取文字檔案和其他更好效的磁碟儲存格式 2.2 使用資料庫中的資料 0.3 利用web api操作網路資源1.讀取文字檔案和其他更好效的磁碟儲存格式pandas提供了一些用於將型資料讀取為dataframe物件的函式。1.1 pandas中的解析函式 read...

Pandas 資料的讀取，儲存

pandas 如果沒有匯入，匯出的操作，那所有的一切資料處理的操作都將毫無意義。將資料讀取為dataframe物件的方法，主要有倆個函式,倆者並無不同，以我看，要是讀取以.csv字尾的檔案，就用第乙個。pd.read csv pd.read table 倆個函式引數設定 sep 拆分資料的字串行，...

Pandas資料儲存

Python之pandas資料載入 儲存

Pandas 資料的讀取，儲存

Python之pandas資料載入 儲存

相關推薦

Python之pandas資料載入儲存

Python之pandas資料載入儲存