python 檔案讀取處理問題記載

2021-09-11 14:01:51 字數 757 閱讀 1464

如果有的檔案有\xef\xbc導致utf-8不能解析,可以這樣做

with open('sss.bcp','r',encoding='utf-8') as f:

while true:

try:

data = f.readline()

if data:

print(data)

else:

break

except:

continue

【如果確定個別不能解析的,不需要解析的話】就用

in [15]: with open('sss.bcp','rb') as f_src:

while true:

data = f_src.readline()

if data:

print(data.decode('utf-8','ignore')) 

else:

break

小結:使用二進位製流去處理,然後對二進位製流進行處理轉換[decode, ignore]

[補充]

content = b'\x00000123456789\x00\x00\x00'

content.decode().strip('\x00')

>>>content

>>>'000123456789

無論是window還是linux直接使用os.sep

windows下os.sep為\\, linux下os.sep為/

poi讀取Excel檔案,數字的處理問題

poi讀取excel檔案時,長一點的數字自動變成了科學計數法,短的數字自動加上了 0 一開始不知道有這個問題,測試了下才發現這個問題,也試了好多辦法去解決,今天發現個完美解決的辦法。numberformat nf numberformat.getinstance hssfcell num hssfr...

perl檔案編碼處理問題

在看perl時,發現檔案編碼處理問題不是很懂。bg了下,發現還是有點東東,so,收藏下 1 乙個指令碼用於分析應用程式的日誌,但是在這些日誌檔案中,有的編碼是utf 8的,有的編碼是gbk的.對於utf 8的日誌檔案,需要將內容轉換成gbk的編碼,這樣看到的中文才不至於亂碼 因此,在perl指令碼中...

下標處理問題

下標處理問題 主要是針對於插入排序演算法寫的程式,其他情況可以借鑑這些思路。數學上或者通常意義上,下標都是從1開始的,但是在多數程式語言裡面陣列下標都是從0開始的,這就很惱火了,簡單乙個下標處理起來卻異常麻煩!請看 例如 1 典型的陣列下標越界問題 假設有個陣列 a 0 a 1 我們要用插入法排序,...