python基礎 之字元編碼

2022-08-30 04:51:11 字數 1259 閱讀 7884

一、何謂編碼

二、編碼發展簡述

assic【英文編碼表】 --> unicode【後各國均發展自己的編碼表,導致編碼表混亂,推出萬國碼unicode】 -->utf-8 【但unicode存乙個字元,統一占用2個位元組,占用空間較大。又推出utf-8,可以根據語言型別,自動調整儲存空間】

三、編碼儲存說明

1位 =1bit; 【最小單位,可理解為計算機二級制位數】

8bit = 1bytes = 1位元組;【每個字元統一用8個bit來表示,此處僅指英文及特殊字元類,共計255個】

1024bytes = 1kbytes = 1kb

1024kb = 1million bytes = 1mb = 1兆

1024mb = 1 gigabytes

1024gb = 1tb

四、編碼格式化輸出

一般用%d表示替換整數,%f表示替換浮點數,%s表示替換字串;

%運算子就是用來格式化字串的。有幾個%?佔位符,後面就跟幾個變數或者值,順序要對應好。如果只有乙個%?,括號可以省略。示例:

>>>'

name: %s,age: %s

' % ('

jack

', 25)

'name:jack, age: 25

'

五、編碼與解碼1.在python2預設編碼是ascii, python3裡預設是unicode

2.unicode 分為 utf-32(佔4個位元組),utf-16(佔兩個位元組),utf-8(佔1-4個位元組), so utf-16就是現在最常用的unicode版本, 不過在檔案裡存的還是utf-8,因為utf8省空間

3.在py3中encode,在轉碼的同時還會把string 變成bytes型別,decode在解碼的同時還會把bytes變回string

(此圖僅適用於py2)

gbk轉換為utf-8流程:

1.通過解碼【decode】轉換為unicode編碼

2.然後通過編碼【encode】轉換為utf-8編碼

utf-8轉換為gbk流程:

1.通過解碼【decode】轉換為unicode編碼

2.然後通過編碼【encode】轉換為gbk編碼

python基礎之字元編碼

1.什麼是字元編碼?字元 標準 字元編碼 數字 2.為什麼要編碼?讓計算機認識人的字元 3.常見的字元編碼 ascii 乙個bytes代表乙個字元 英文本元 鍵盤上的所有其他字元 1bytes 8bit,8bit可以表示0 2 8 1種變化,即可表示256個字元 gbk 2bytes代表乙個字元,由...

Python基礎之字元的編碼

python廖雪峰 計算機只能處理二進位制數字 0100111 要處理文字,就必須先把文字轉為數字才能處理,這個過程就叫編碼。由於計算機是美國人發明的,最早只有127個字元被編碼到計算機裡,包括大小寫英文本母 陣列和一些符號,這個編碼表被稱為ascii編碼,比如大寫字母a的編碼是65,小寫字母z的編...

python 基礎 字元編碼

編碼基礎 由於每個國家都有自己的字元,所以其對應關係也涵蓋了自己國家的字元,但是以上編碼都存在侷限性,即 僅涵蓋本國字元,無其他國家字元的對應關係。應運而生出現了萬國碼,他涵蓋了全球所有的文字和二進位制的對應關係。unicode 2 4位元組 已經收錄136690個字元,並還在一直不斷擴張中.uni...