python讀取檔案亂碼

2021-06-29 00:29:20 字數 1685 閱讀 4951

方法一:使用codecs
importcodecs
f = codecs.open('nlpir/readme.txt','r','gbk')

line = f.readline()

whileline:

printline,

line = f.readline()

f.close()

上面的方法很慢,可以直接讀取整個檔案
codecs.open('nlpir/readme.txt','r','gbk').read()
還有這樣讀的readlines()

方法二:

#讀取文件

def read_file():

path1='k:\\sogouc.reduced\\reduced\\c000008\\10.txt'

f = open(path1,'r+')

file_list = f.read().decode("gbk")

print file_list

f.close()

#逐行讀取文件

def read_file_line():

path1='k:\\sogouc.reduced\\reduced\\c000008\\10.txt'

f = open(path1,'r+')

line = f.readline()

while line:

print line.decode('gbk')

line = f.readline()

f.close()

帶bom頭

def readweibo():

f = codecs.open(u'h:/資料/weibo/weibo.txt','r','utf-8')

line = f.readline()

if line[:3] == codecs.bom_utf8:

line = line[3:]#去除bom頭

i=0while line:

print line,

line = f.readline()

if i>10:

break

f.close()

return

readweibo()

顯示行數的讀取

def test_read():

file_path = u"d:/dev_data/idf_data/weibo/weibo_text.txt"

f = open(file_path, "r")

for i,line in enumerate(f):

print i,line,

if i>10:

break;

f.close()

python 讀取檔案亂碼問題

一 問題 python讀取檔案時會遇到亂碼的問題 二 解決方法 1 已utf 8格式開啟文件 f open r e python liaotian.txt r encoding utf 8 f.seek 0,0 for each line in f print each line f.close 2...

python讀取檔案亂碼問題

今天突然想做乙個實時讀取 日誌檔案的程式,然後用python爬蟲直接爬取檔案,用唯讀的方式開啟避免對 系統 寫入日誌 造成影響。上 usr bin env python coding utf 8 import subprocess import time import chardet p 0 wit...

Python中讀取檔案亂碼

python中讀取目標檔案後,控制台出現亂碼,解決方案 file path r f wechat wechat files filename.txt with open file path,rb as file object contents file object.read print conte...