python讀取txt檔案時的中文亂碼問題

2021-07-30 04:34:04 字數 801 閱讀 8862

今晚在做

上的python小練習0011題時,一直出現以下『utf-8』無法decode的問題:

utf8' codec can't decode byte 0xb1 in position 0: invalid start byte

即使我借鑑

中errors = 『replace』的形式,雖然錯誤沒有了,但訓練目標卻也達不到。

摸索了很長世間,最後還是用gb18030編碼解決了問題,只是原因尚不自知,在此附上**,下次若出現類似問題,多用幾種編碼形式試試。

__author__ = 'moon.d.carl'

# -*- coding:'utf-8' -*-

#敏感詞文字檔案 filtered_words.txt,裡面的內容為以下內容,當使用者輸入敏感詞語時,則列印出 freedom,否則列印出 human rights。

import sys

reload(sys)

sys.setdefaultencoding('utf-8')

path = 'e:/python_practise_material/0011.txt'

filtered_words = [words.strip('\n').decode('gb18030') for words in open(path, 'r')]

input_word = raw_input()

print 'freedom' if unicode(input_word, 'gb18030') in filtered_words else 'human rights'

Python讀取TXT檔案時出現「ufeff「字元

問題描述 目的 在command.txt檔案中讀取文字,然後轉換成數字列表。這是 內容 cmd open command.txt rt encoding utf 8 datals for line in cmd line line.replace n for ls in datals print l...

Python 讀取TXT檔案

一 開啟檔案 f open filename,access mode r buffering 1 filename 檔名 access mode 開啟方式,r讀,w寫,a追加,r w a 都是以讀寫方式開啟,rb二進位制讀,wb二進位制寫,rb wb ab 二進位制讀寫 buffering 預設值 ...

python 讀取txt檔案

txt檔案內容 1.全部讀取 file open e others 測試.txt r 開啟檔案 f all file.read 讀取所有檔案內容 print f all file.close 關閉檔案結果 2.按行讀取 file open e others 測試.txt r 開啟檔案 for lin...