python中幾種編碼格式問題

學習python的時候，發現寫**都要在開始一行加上# coding=utf-8，不然在pycharm裡面有中文注釋或者**裡面有中文的話編輯**就會報錯，關於寫python**得在第一行宣告編碼格式的原因，上網搜尋了一下： **一、# coding=utf-8的作用** 開頭的coding=utf-8和coding:utf-8的作用是一樣的。作用是宣告python**的文字格式是utf-8，python按照utf-8的方式來讀取程式。如果不加這個宣告，無論**中還是注釋中有中文都會報錯。

以下兩種寫法是等價的：

# coding=utf-8 # coding:utf-8 # 注意一點無論中間是：還是=，其中coding與它們之間都不能有空格。否則也會報錯。

# encoding: utf-8

以上知識點引用於 (侵權必刪)

二、python的編碼格式

python直譯器預設使用的是unicode編碼，但由於unicode編碼是兩個位元組表示乙個字元，與ascii編碼的乙個位元組(ascii碼最多只能表示2^7=128個字元，因為其最高位總是0)表示相比就很浪費計算機資源，所以python直譯器實際儲存用的是utf-8編碼(utf-8編碼中英文用乙個位元組表示，中文用三個位元組表示)。

三、python生成文字檔案出現亂碼問題

在python**中生成文字檔案，往文字檔案裡面寫入中文資料，有時候會發現檔案裡面顯示亂碼，原因是開啟文字檔案時預設的編碼格式是gbk,而python直譯器預設使用的編碼格式是unicode,所以當文字檔案裡面有中文的時候會出現亂碼問題.

以上內容是為了做個筆記，錯誤之處懇請指出，謝謝

python中幾種編碼格式問題

python編碼格式問題

幾種常見的編碼格式

python中字元，位元組，編碼格式等問題總結

python中幾種編碼格式問題

python編碼格式問題

幾種常見的編碼格式

python中字元，位元組，編碼格式等問題總結

相關推薦