編碼基礎概念 ANSI和unicode

2021-09-19 22:46:47 字數 855 閱讀 2512

ansi指american national standards institute(美國國家標準學會)。

ansi編碼不是一種具體的編碼方式,而是一種指定在某些環境下使用某些編碼方式的標準。比如,在中文環境中ansi的編碼標準為gbk,在日語環境中ansi的編碼標準則是shift_jis編碼。

ascii編碼使用0×00~0x7f之間的每個位元組表示乙個字元,英語世界之外的其他國家對此字符集進行了擴充套件,除了ascii字符集之外,他們1個到4個位元組來表示乙個字元,形成了自己語言的編碼方式,比如gbk, big5、shift_jis等。

中文環境下ansi編碼對應的編碼方式為gbk,gbk的編碼規則為:

a) 對於ascii字符集中的字元,使用ascii編碼(也就是說gbk編碼是相容ascii編碼的);

b) 非ascii字元使用gb標準。最早是gb2312,但是由於該標準收錄的漢字數較少,後來就被gb18030取代。gb18030也在不斷擴充套件,gb18030-2005收錄了70244個漢字。本文不在敘述gbk的具體編碼規則,簡單來說該標準表達單個字元使用1位元組、2位元組、4位元組這三種情況。

asni編碼是不利於跨語言資料交流的,比如windows檔案預設使用ansi編碼。那麼,在中文windows下建立的檔案,在日文windows下是無法正確解析的,因為日文windows下ansi編碼使用的是shift_jis編碼。

為了統一世界各種語言的編碼,unicode編碼被創造出來,需要注意的是unicode也不是乙個具體的編碼規則,在unicode標準下,有utf-8,utf-16等具體的實現。他們都對應不同的編碼規則。

在某個角度理解,ansi編碼是一種歷史遺留,應該被淘汰,進而使用更加先進、方便的unicode編碼。

字元 位元組的概念和區別 編碼概念

位元組 byte 位元組是通過網路傳輸資訊 或在硬碟或記憶體中儲存資訊 的基本單位。位元組是計算機資訊技術用於計量儲存容量和傳輸容量的一種計量單位,1個位元組等於8位二進位制,它是乙個8位的二進位制數,是乙個很具體的儲存空間。字元人們使用的記號,抽象意義上的乙個符號。比如鍵盤上敲出的數字 字母 各種...

筆記 數字語音編碼基礎概念

聲音是什麼 聲音是聽覺器官對聲波的感知,而聲波是通過空氣或其他 傳播的連續振動。聲音的強弱體現在聲波壓力的大小上,音調的高低體現在聲音的頻率上 頻率 訊號的頻率是指訊號每秒鐘變化的次數,用hz表示 頻率為20hz 20khz的訊號都稱為聲音,20hz 20khz範圍的頻率稱為聲音頻率,簡稱為 音訊 ...

DDOS概念和防禦基礎

ddos概念 分布式拒絕 服務攻擊英文縮寫即 ddos ddos的攻擊方式有很多種,最基本的 dos攻擊就是利用合理的 服務請求來占用過多的服務資源,從而使合法使用者無法得到服務的響應。ddos攻擊手段是在傳統的dos攻擊基礎之上產生的一類攻擊方式。單一的dos攻擊一般是採用一對一方式的,當攻擊目標...