pandas檔案讀取

2021-09-26 05:32:59 字數 807 閱讀 4068

#改變工作路徑

import os

print(os.getcwd())#列印當前工作目錄

print(os.listdir())

os.chdir(『c:/users/administrator』)

import pandas as pd

for price in dfs1:

print(price)

『』』讀取資料是指定乙個列作為行索引 index_col=「msg」

讀取資料時指定多個列作為行索引 index_col=[「a」,「b」]

處理不規整的分割符 pd.read_table(『data/ex3.csv』, sep=』\s+』)

#讀取檔案是指定那些是預設值 na_values=[『na』,『null』]

#指定那些列的那些值為預設值 na_values=

#逐塊讀取 nrows=10

#產生乙個貼袋器讀取檔案 chunksize=10

『』』tr = pd.read_csv(『data/ex6.csv』, chunksize=1000) #tr為返回的乙個迭代器 textfilereader

key_count = pd.series()

for pieces in tr:

key_count = key_count.add(pieces[『key』].value_counts(), fill_value=0) #series的相加,自動索引對齊

key_count = key_count.sort_values(ascending=false) #排序

key_count[:10]

pandas讀取xml檔案

原創答案來自stackflow import pandas as pd from xml.sax import contenthandler,parse reference class excelhandler contenthandler def init self self.chars self...

pandas讀取csv檔案

import pandas as pd pd.set option display.max columns none 在pycharm下可以顯示所有列 pd.set options display.max rows none 在pycharm下可以顯示所有行 給每一列命名,注意第一行的設定 data...

pandas讀取excel檔案

import pandas as pd 先將檔案讀到記憶體中形成乙個datefream people pd.read excel r people.xlsx 檢視行數和列數 print people.shape 檢視列名 當直接列印datefream時 id不會顯示 datefream對待index...