python基礎之編碼的定義和種類

2022-08-27 18:24:09 字數 768 閱讀 1579

- 電腦將人類的語言轉換成機器特有的語言,即編碼進行訪問,二進位制數字。

1. **ascii 英文**,8個數字表示1個單位,一共有2**8個,可以表示所有的英文、數字及符號,8個數字為1個位元組

2. **unicode 萬國語**,32個數字表示1個單位,共計有2**32個,目前還有很多空缺,32個數字為4個位元組

3. **utf-8**, unicode的縮減版,unicode相比於ascii優點是每個國家的文字都可以直接轉譯成編碼,缺點是由於32個數字(即4個位元組)表示1個單位,比較占用空間,在這個基礎上,utf-8可以將unicode中未使用的0進行省略,但是只會每8位省略,中文3個位元組

# -*- coding:utf-8 -*- # 使用這組編碼可以讓python2使用utf-8進行編碼

print("你好 世界")

print("你好 世界")

編碼種類:

字串"中國人" 乙個字串= 三個字元= 9個位元組(utf-8)=6個位元組(gbk)(在沒有定義編碼的前提下,位元組與字元沒有關係)

單位換算:

​ 1byte = 8 bit 任何編碼 ,1個位元組等於8個數字,數字指基本的二進位制數字

​ 1kb = 1024byte

​ 1mb = 1024kb

​ 1gb = 1024 mb

​ 1tb = 1024 gb

​ 1pb = 1024 tb

Python基礎之字元的編碼

python廖雪峰 計算機只能處理二進位制數字 0100111 要處理文字,就必須先把文字轉為數字才能處理,這個過程就叫編碼。由於計算機是美國人發明的,最早只有127個字元被編碼到計算機裡,包括大小寫英文本母 陣列和一些符號,這個編碼表被稱為ascii編碼,比如大寫字母a的編碼是65,小寫字母z的編...

Python基礎之函式的定義和呼叫

定義函式的格式如下 def 函式名 定義乙個函式,能夠完成列印資訊的功能 defprintinfo print print 人生苦短,我用python print 定義了函式之後,就相當於有了乙個具有某些功能的 想要讓這些 能夠執行,需要呼叫它 呼叫函式很簡單的,通過 函式名 即可完成呼叫 定義完函...

python基礎六之編碼

python中編碼的特點 1,各個編碼之間的二進位制是不能互相識別的,會產生亂碼 2,檔案的儲存和傳輸是不能用unicode的 在python3中字串在記憶體中是用unicode編碼的,而要完成儲存和傳輸則要將str轉換為bytes型別。bytes的操作方式和str相同,但是它的編碼和str不同,可...