字元編碼複習

2022-10-10 21:21:21 字數 737 閱讀 4423

記憶體中的都是unicode明文(二進位制資料)

unicode把明文對應成乙個二進位制,utf8是把unicode的二進位制再轉成乙個二進位制

兩種都是一種編碼方式

unicode*(明文對應二進位制)兩個位元組,六萬多個狀態,全世界

utf8:(二進位制對應二進位制)可變的(中文一般用三個字元,因為程式設計用中文的太少所以還是省空間)

為什麼不將unicode直接存到磁碟,傳輸,因為utf8比unicode更節省空間

world開啟檔案的過程:你寫上的字先進記憶體(unicode形式的二進位制資料),點儲存(二進位制的unicode按utf8再轉成二進位制)

儲存到磁碟;開啟檔案的過程,把磁碟上的utf8轉換成decode的unicode編碼,然後到記憶體就能看了

所以你encode存的時候,跟decode開啟的時候編碼一定要一樣

python直譯器的#coding:utf8就是告訴我直譯器,按utf8進行解碼

python直譯器的翻譯是一行一行的解釋

pthon2.x

1,str: bytes資料 str只是個名字 (print type時的顯示)

2,unicode: unicode編碼後的二進位制資料 unicode也只是字名字

只要是unicode就是encode操作,只要是bytes資料就是decode操作

python3完完全全把位元組型別跟字元型別完全分開,混用會報錯

python3.x

1,2,

字元編碼 unicode編碼

1.ascii american standard code for information interchange 美國資訊交換標準 這是計算機上最早使用的通用的編碼方案。那個時候計算機還只是拉丁文本的專利,根本沒有想到現在計算機的發展勢頭,如果想到了,可能一開始就會使用unicode了。當時絕大...

A 字元編碼

請將一串長度為5的純字母文字譯成乙個密碼,密碼規律如下 用原來的字母後面的第4個字母代替原來的字母。如c用g代替 文字中不存在w w x x y y z z等字母 最後得到的文字即為密碼。輸入一串文字,長度固定為5。輸出對應的密碼。格式為 password is 密碼 input chinaoutp...

複習 文字編碼格式

文字編碼格式主要 ascii,gbk,gb2312,unicode,utf 8 ascii 最初發布,包含空格 標點符號 數字 大小寫字母和控制符 一位元組 gb2312 6000多個常用漢字的編碼,僅國內使用 gbk 在gb2312基礎上擴充套件繁體和符號 unicode ios,國際標準化 兩位...