python 檔案讀取處理問題記載

如果有的檔案有\xef\xbc導致utf-8不能解析，可以這樣做
with open('sss.bcp','r',encoding='utf-8') as f:
while true:
try:
data = f.readline()
if data:
print(data)
else:
break
except:
continue
【如果確定個別不能解析的，不需要解析的話】就用
in [15]: with open('sss.bcp','rb') as f_src:
while true:
data = f_src.readline()
if data:
print(data.decode('utf-8','ignore')) 
else:
break
小結：使用二進位製流去處理，然後對二進位製流進行處理轉換[decode, ignore]
[補充]
content = b'\x00000123456789\x00\x00\x00'
content.decode().strip('\x00')
>>>content 
>>>'000123456789
無論是window還是linux直接使用os.sep 
windows下os.sep為\\, linux下os.sep為/

poi讀取Excel檔案，數字的處理問題

poi讀取excel檔案時，長一點的數字自動變成了科學計數法，短的數字自動加上了 0 一開始不知道有這個問題，測試了下才發現這個問題，也試了好多辦法去解決，今天發現個完美解決的辦法。numberformat nf numberformat.getinstance hssfcell num hssfr...

perl檔案編碼處理問題

在看perl時，發現檔案編碼處理問題不是很懂。bg了下，發現還是有點東東，so，收藏下 1 乙個指令碼用於分析應用程式的日誌,但是在這些日誌檔案中,有的編碼是utf 8的,有的編碼是gbk的.對於utf 8的日誌檔案,需要將內容轉換成gbk的編碼,這樣看到的中文才不至於亂碼因此,在perl指令碼中...

下標處理問題

下標處理問題主要是針對於插入排序演算法寫的程式，其他情況可以借鑑這些思路。數學上或者通常意義上，下標都是從1開始的，但是在多數程式語言裡面陣列下標都是從0開始的，這就很惱火了，簡單乙個下標處理起來卻異常麻煩！請看例如 1 典型的陣列下標越界問題假設有個陣列 a 0 a 1 我們要用插入法排序，...

python 檔案讀取處理問題記載

poi讀取Excel檔案，數字的處理問題

perl檔案編碼處理問題

下標處理問題

相關推薦