Pandas 03 檔案讀和儲存

2021-10-06 21:29:17 字數 2623 閱讀 1622

詳解pandas檔案讀寫和儲存

1、pandas.read_csv讀取檔案

2、快速瀏覽讀入的資料

3、pandas.dataframe.to_csv寫入檔案

4、參考資料 

pandas能處理多種**資料型別:詳細見

data1 name2 age3

data name age

2018-6-16 李 20

2018-6-13 佳 22

2018-6-16 楊 3

2018-6-11 靜 10

2018-6-12 海 29

2018-6-11 貝 51

2018-6-12 cao 36

2018-6-11 liu 28

2018-6-12 君 7

2018-6-12 琪1 31

import numpy as np

import matplotlib

import pandas as pd

data = pd.read_csv('./pd_io.txt', sep='\t',header=1, encoding='utf-8',na_filter=true, nrows=500, na_values='cao')

##引數介紹

#sep,設定檔案每行內容的分隔符,此處設定為table分割;

#header,設定列標籤,預設設定第一行為標籤名,即header=0,此處設定第二行為列標籤;

#encoding,檔案編碼方式;

#na_filter,對於空值要不要當做預設值(nan)處理,預設為true;

#nrows,指定讀取前多少行,預設讀取所有行

#na_values,指定某個值為預設值,pandas.dataframe預設的預設值為:

'''nan: 『』, 『#n/a』, 『#n/a n/a』, 『#na』, 『-1.#ind』, 『-1.#qnan』,

『-nan』, 『-nan』, 『1.#ind』, 『1.#qnan』, 『』, 『n/a』, 『na』,

『null』, 『nan』, 『n/a』, 『nan』, 『null』.'''

in [81]:data#檢視讀入的檔案資料

當讀入的檔案比較大時:info|head|tail|dtypes方法快速瀏覽資料。

data.info#info檢視檔案的基本資訊
rangeindex: 10 entries, 0 to 9#index內容

data columns (total 3 columns):#列標籤內容

data    9 non-null object#data#每一列資料簡要介紹

name    9 non-null object#

age     10 non-null int64

dtypes: int64(1), object(2)#資料型別

memory usage: 320.0+ bytes#記憶體使用情況

data.dtypes#dtypes檢視檔案的資料型別

data.to_csv("pd_out.txt", sep='\t',header=0, index=0, na_rep='這裡是nan值老鐵', float_format='%.3f', columns=['data','name'])

#引數含義

#sep,預設為逗號,這裡設定為table;

#header,是否保留列名,預設值為1保留,此處設定為0不保留;

#index,是否保留行索引,預設為1保留,此處設定為0不保留;

#na_rep,預設值nan是否替換,預設為空('');

#float_format,浮點型資料設定保留小數字數,這裡設定保留三位小數;

#columns,設定要儲存的列,傳入型別為列表,這裡設定保留兩列;

寫入後的檔案'pd_out.txt'

2018-6-16 李

2018-6-13 佳

2018-6-16 楊

2018-6-11 靜

2018-6-12 海

2018-6-11 貝

2018-6-12 這裡是nan值老鐵

2018-6-11 liu

2018-6-12 君

這裡是nan值老鐵 琪1

Kafka 實戰 03 檔案儲存詳解

從圖中的架構我們可以看到,一類訊息即topic分為了三個分割槽partition,每乙個partition分割槽 由多個segment,乙個segment存在乙個.log檔案,乙個.index檔案。1 topic 可以理解為乙個佇列,生產者和消費者面向同乙個 topic 訊息佇列可能有很多訊息,但是...

03 檔案和目錄管理

unit3 browsing the filesystem 1.linux file hierarchy concepts 樹狀架構 表示當前目錄 表示當前使用者的家目錄。2.some important directories 1 the home directories root home 2 ...

python筆記03 檔案操作

建立乙個檔案名字為filename 內容是bj shgd twf open filename r encoding utf 8 print f.encoding utf 8 print f.fileno 3f open filename encoding utf 8 data f.read prin...