指定編碼格式copyc Python 的編碼介紹

2021-10-16 06:44:29 字數 1014 閱讀 5897

python 檔案中如果未指定編碼,在執行過程會出現報錯:

#!/usr/bin/python

print ("你好")

python中預設的編碼格式是 ascii 格式,在沒修改編碼格式時無法正確列印漢字,所以在讀取中文時會報錯。

解決方法為只要在檔案開頭加入 # -*- coding: utf-8 -*- 或者 # coding=utf-8 就行了

如下:#!/usr/bin/python

# -*- coding: utf-8 -*-

print( "你好" )

如果使用編輯器,同時需要設定 py 檔案儲存的格式為 utf-8,否則會出錯。

python3.x 原始碼檔案預設使用utf-8編碼,所以可以正常解析中文,無需指定 utf-8 編碼。

pycharm 設定步驟:

進入 file > settings,在輸入框搜尋 encoding。

找到 editor > file encodings,將 ide encoding 和 project encoding 設定為utf-8。

常用編碼方案簡介:

gbk是國家標準gb2312基礎上擴容後相容gb2312的標準。gbk的文字編碼是用雙位元組來表示的,即不論中、英文本元均使用雙位元組來表示,為了區分中文,將其最高位都設定成1。gbk包含全部中文字元,是國家編碼,通用性比utf8差,不過utf8占用的資料庫比gbk大。

gbk、gb2312等與utf8之間都必須通過unicode編碼才能相互轉換:

gbk、gb2312--unicode--utf8

utf8--unicode--gbk、gb2312

簡單從功能上說:

1、gbk通常指gb2312編碼 只支援簡體中文本

2、utf通常指utf-8,支援簡體中文本、正體中文本、英文、日文、韓文等語言(支援文字更廣)

3、通常國內使用utf-8和gb231

指定編碼格式copyc Python編碼規範彙總

文章目錄 編碼格式宣告 縮排 引號 空行 匯入模組 命名規範 通常,編碼格式宣告是必需的。如果 python 原始碼檔案沒有宣告編碼格式,python 直譯器會預設使用 ascii 編碼,一旦原始碼檔案包含非ascii編碼的字元,python 直譯器就會報錯。以 utf 8 為例,以下兩種編碼格式宣...

mysql指定編碼集

drop table create table varchar 20 not null comment 應用id null comment 應用名稱 source market varchar 50 comment 應用市場 version varchar 10 comment 版本號 update...

mysql建立資料庫指定編碼格式

在mysql中使用sql語句建立資料庫時,老是忘記指定編碼格式。這就導致了使用utf 8格式的project訪問資料庫的過程中產生中文亂碼的問題。後來發現大部分問題出自建立資料庫的時候沒有指定編碼格式。建立資料庫指定編碼格式的一種方法是在建立資料庫sql語句中指定編碼格式,例如以下所看到的,指定資料...