python讀取檔案格式化方法

2021-09-11 07:25:58 字數 1665 閱讀 4479

介紹python的一種較為通用的讀取檔案並進行格式化的方法。

第一種檔案格式:

一行資料是乙個特徵向量,最後一項是標籤,表示類別。資料之間用空格分隔。目的是輸入這樣的檔案路徑,得到它格式化形成的特徵向量和標籤向量。

**

def

filetonumpy

(filename)

:file

=open

(filename)

file_lines =

file

.readlines(

) numberoflines =

len(file_lines)

dataarray = np.zeros(

(numberoflines,3)

) labels =

index =

0for line in file_lines:

line = line.strip(

)# 引數為空時,預設刪除開頭、結尾處空白符(包括'\n', '\r', '\t', ' ')

formline = line.split(

'\t'

) dataarray[index,:]

= formline[0:

3](formline[-1

])) index +=

1return dataarray, labels

filename =

"datingtestset.txt"

dataarray, labels = filetonumpy(filename)

第二種檔案格式類似,但是用逗號分隔

這種檔案是csv格式檔案,把它當作普通檔案來處理。

**

def

filetonumpy_2

(filename)

:file

=open

(filename)

lines =

file

.readlines(

) length =

len(lines)

data = np.zeros(

(length,3)

) labels =

index =

0for line in lines:

line = line.strip(

) one = line.split(

',')

data[index,:]

= one[0:

-1]-

1]) index +=

1return data, labels

filename =

"testdata.txt"

data, labels = filetonumpy_2(filename)

print

(data)

print

(labels)

linux 檔案格式化

1 按兩下小寫g,即gg,定位游標到第一行。2 按住shift v,即大寫v,進入視覺化編輯的列編輯模式。3 shift g,即大寫g,選中整個 4 按下等號 格式化所有 libxml2 是乙個xml的c語言版的解析器,本來是為gnome專案開發的工具,是乙個基於mit license的免費開源軟體...

python 讀寫檔案格式化輸出

python讀寫檔案 1.open file object open thefile.txt try all the text file object.read finally file object.close 2.讀檔案 讀文字檔案 input open data r 第二個引數預設為r inp...

Python格式化JSON檔案

之前工作中有乙個需求是要格式化json檔案,遇到乙個問題,是要把乙個json檔案裡面的內容格式化一下,在此做個記錄 import json class jsonformat 初始化json原始檔和新檔案位址 def init self,filepath,newpath self.filepath f...