python讀取各種檔案資料解析

2021-08-09 03:10:37 字數 3382 閱讀 7521

1.讀取文字檔案資料(.txt結尾的檔案)或日誌檔案(.log結尾的檔案)

以下是檔案中的內容,檔名為data.txt(與data.log內容相同),且處理方式相同,呼叫時改個名稱就可以了:

以下是python實現**:

# -*- coding:gb2312 -*-

import json

defread_txt_high

(filename):

with open(filename, 'r') as file_to_read:

list0 = #檔案中的第一列資料

list1 = #檔案中的第二列資料

while

true:

lines = file_to_read.readline() # 整行讀取資料

ifnot lines:

break

item = [i for i in lines.split()]

data0 = json.loads(item[0])#每行第乙個值

data1 = json.loads(item[1])#每行第二個值

return list0,list1

aa,bb = read_txt_high('data.txt')

print aa

print bb

若是日誌檔案(.log結尾的檔案),輸入以下:

aa,bb = read_txt_high('data.log')

print aa

print bb

執行結果如下:

2.讀取.xml結尾的檔案

xml檔案的名稱為abc.xml, 內容如下圖所示:

以下是實現**:

# -*- coding:gb2312 -*-

# coding = utf-8

from pylab import *

import xml.dom.minidom

defread_xml

(): dom = xml.dom.minidom.parse('abc.xml')#開啟xml文件

cc=dom.getelementsbytagname('caption')

list_str = #字串

for item in cc:

bb = dom.getelementsbytagname('maxid')

list_fig =

for item in bb:

su = list_fig[0].encode("gbk")

list_fig2 = su.split(",")

list_fig_num =

for i in list_fig2:

ee = dom.getelementsbytagname('time')

list_tim =

for item in ee:

sg = list_tim[0].encode("gbk")

list_time = sg.split(",")

gg = dom.getelementsbytagname('font_size')

g1 =

for item in gg:

su = g1[0].encode("gbk")

return list_str,list_fig_num,list_time,su

呼叫此函式如下所示:

a,b,c,d = read_xml()

print a

print b

print c

print d

輸出結果如下圖所示:

3.讀取excel檔案資料,並將其存入list列表中

excel**中的資料如下圖所示,**命名為data.xlsx:

首先將id列中的資料儲存到列表list_col中,實現**如下所示:

# -*- coding: utf-8 -*-

import xlrd

import json

defread_ex_stop_ptline

():# 開啟檔案

workbook = xlrd.open_workbook(r'data.xlsx')

sheet = workbook.sheet_by_name('ptline')

list_col =

for i in range(1,sheet.nrows):

c = sheet.cell(i,3).value

print list_col

呼叫此函式,輸出結果如下:

以下將linkidsequence列資料存放到乙個list中,即list_ele中,實現**如下:

# -*- coding: utf-8 -*-

import xlrd

import json

defread_ex_stop_ptline

():# 開啟檔案

workbook = xlrd.open_workbook(r'data.xlsx')

sheet = workbook.sheet_by_name('ptline')

list_ele = #第八列的所有資料放入乙個list中

for i in range(1,sheet.nrows):

c = sheet.cell(i, 8).value

cc = json.loads(c) #第八列的每個單元格處理為乙個list

for j in range(len(cc)):

print list_ele

呼叫函式read_ex_stop_ptline,輸出結果如下圖所示:

python讀取文字檔案資料

常用資料檔案內容格式如下 10,張三,22,男,172,57,95 11,李四,25,男,180,65,90 12,王紅,23,女,160,50,99 從該文字資料可以看出,一般為 一行一樣本,一列一特徵,每個特徵之間用特殊字元 如逗號,空格 分割 1 csv 檔案 csv檔案 逗號分割值檔案 nu...

python各種檔案讀取

目錄 1 json檔案 2 csv 3 用with來讀取檔案,可避免忘掉f.close 4 用pandas讀取excel csv檔案 1 json檔案樣式 資料儲存在鍵值中 鍵值對間由逗號分隔 花括號用於儲存鍵值對資料組成的物件 方括號用於儲存鍵值對資料組成的陣列 多個物件組成 2 json檔案操作...

Python資料分析筆記 檔案資料讀取

讀取檔案內容首行 path c users etisan desktop a.txt open path readline 注 檔案路徑要用雙反斜槓 第乙個 的作用是轉義字元 讀取檔案內容某一行 records line for line in open path records 1 匯入json,...