Python3處理gb2312編碼的XML檔案

2021-10-23 18:07:22 字數 480 閱讀 5960

本篇使用場景為需要修改的檔案是xml格式,且是gb2312編碼。

使用open由於編碼不支援的問題,導致打不開gb2312編碼的xml檔案或xml檔案中編碼格式不同導致報錯。

導入庫codecs

import codecs

# 指定使用gb2312編碼開啟檔案,返回unicode

lines = codecs.open(file_name, 'r', 'gb2312').readlines()

# 寫入時同理

codecs.open(file_name, 'w', 'gb2312').writelines(lines)

普通open(),只能寫入str型別,不管字串是什麼編碼方式,如果要強制寫入必須將獲取的資料先decode解碼為unicode,再encode為str寫入。

而codecs.open()可以指定乙個編碼開啟或寫入檔案,即可解決編碼問題導致的讀取或寫入檔案失敗。

python3 處理檔案

fhand open text.txt python裡面的open 函式返回乙個file handler,如果你print fhand 的話,得到一些跟檔案有關的資訊 name text.txt mode r encoding us ascii 今天實現了乙個讀取每一行,分別輸出並統計行數的功能 f...

Python3處理HTTP請求

python3處理http請求的包 http.client,urllib,urllib3,requests 其中,http 比較 low level,一般不直接使用 urllib更 high level一點,屬於標準庫。urllib3跟urllib類似,擁有一些重要特性而且易於使用,但是屬於擴充套件...

Python3處理日期與時間

import time 獲取當前時間的時間戳 print time.time 獲取10位時間戳 print int time.time 獲取13位時間戳 示例 import time 時間戳 結構化時間元組 print time.localtime print time.localtime time...