python編碼筆記

2021-08-15 17:24:55 字數 372 閱讀 7501

一段程式讀入了utf-8檔案,再print出來,在pycharm中可以正常執行,在cmd中報'gbk' codec can't encode錯誤,是因為cmd預設使用gbk輸出,如果在程式中print了一段utf-8字元則會報此錯誤,解決方法是:

file=open(filepath, encoding='utf-8')  #以檔案本身格式讀入(此處為utf-8),此時readline的字串為相應格式

print(file.readline().encode('gbk','ignore').decode('gbk'))  #將字串轉為cmd可輸出的格式即gbk,同理,在linux下顯示gbk檔案也要先以gbk格式open檔案,在輸出時轉為utf-8格式

編碼 python筆記

為了避免亂碼問題,應當始終堅持使用 utf 8 編碼對str和bytes進行轉換。usr bin env python3 coding utf 8 第一行注釋是為了告訴 linux os x 系統,這是乙個 python 可執行程式,windows 系統會忽略這個注釋 第二行注釋是為了告訴 pyth...

Python學習筆記 編碼問題

想要徹底搞清楚編碼問題,我們必須要先搞清楚計算機是怎麼儲存資料的,這就涉及到了計算機基礎的幾個概念了,開篇我們就先來捋捋這幾個容易混淆的概念。bit二進位制位,是計算機內部資料儲存的最小單位,11010100是乙個8位二進位制數。乙個 二進位制位只可以表示0和1兩種狀態 2 1 兩個二進位制位可以表...

python爬蟲筆記 編碼問題

importurllib2 importurllib importrequests frombs4 importbeautifulsoup url respones requests.get url text soup beautifulsoup respones,html.parser info ...