python 字元編碼轉換詳解

2021-08-06 01:19:45 字數 1138 閱讀 7982

unicode所有的中文或者英文都是占用兩個位元組 ,16位

ascii 只能存英文 ,8位

utf-8 可變長的字元編碼,所有英文按ascll佔乙個位元組,常用中文字元用utf-8編碼占用3個位元組

#-*- coding:gbk -*-

import sys

# with語句 為了避免開啟檔案後忘記關閉,可以通過管理上下文,即

#好處 他不用在關閉檔案close 他會自動操作關閉

with open("yesterday","r",encoding="utf-8") as f:

for line in f:

print(line.strip())

#檢視系統預設編碼

print(sys.getdefaultencoding())

#----------------------python2轉碼-----------------------

'''s="你好"

# uft-8 -->uniconde -->gbk

s_to_unicode=s.decode("utf-8") #utf-8轉換為unicode 告訴uuniconde 我原來是utf-8

print(s_to_unicode)

s_to_gbk=s_to_unicode.encode("gbk")#uniconde轉換為gbk

print(s_to_gbk)

#gbk --> uniconde -->utf-8

#gbk轉為uniconde ,uniconde轉為utf-8

gbk_to_utf=s_to_gbk.decode("gbk").encode("utf-8")

'''#---------------------python3轉碼-----------------------

#unicode 可以等於utf-8  所以可一直直接轉個gbk

s="你好"

s_gbk=s.encode("gbk")

print(s_gbk)

print(s.encode())

gbk_to_utf8=s_gbk.decode("gbk").encode("utf-8")

print(gbk_to_utf8)

print("utf-8",gbk_to_utf8)

python字元編碼轉換

python 預設指令碼檔案都是 utf 8 編碼的,當檔案中有非 utf 8 編碼範圍內的字元的時候就要使用 編碼指示 來修正.關於 sys.defaultencoding,這個在解碼沒有明確指明解碼方式的時候使用。檔案編碼 python預設的編碼方式是unicode s 你好 轉換成utf 8編...

詳解MySQL字元的編碼轉換問題

今天我們同大家介紹一下 詳解mysql字元的編碼轉換問題 希望對大家有所幫助,並和大家一起來 交流。我們大家都知道容易過想搞好乙個站的二次開發,可以用的原資料庫的編碼有兩種,即gbk與lation1。而我用的是 gbk,就涉及到編碼轉換問題。這裡在lijun027 s blog查到乙個詳細的編碼比較...

python 字元編碼識別及轉換

python教程 如何檢視字串編碼 python isinstance 函式 python字串編碼 import chardet str1 你好啊!print chardet.detect str1 輸出如下。python 2.x 預設的字元編碼是 ascii,預設的檔案編碼也是 ascii。pyt...