各種編碼彙總

2021-08-15 15:42:58 字數 1764 閱讀 7877

1.解釋

url編碼是一種瀏覽器用來打包表單輸入的格式

url 只能使用 ascii 字符集來通過網際網路進行傳送。由於 url 常常會包含 ascii 集合之外的字元,url 必須轉換為有效的 ascii 格式。

url 編碼使用 「%」 其後跟隨兩位的十六進製制數來替換非 ascii 字元

url 不能包含空格。url 編碼通常使用 + 來替換空格。

2.編碼規則
任何特殊的字元(就是那些不是簡單的七位ascii,如漢字)將以百分符%用十六進製制編碼,當然也包括象 =,&;,和 % 這些特殊的字元。其實url編碼就是乙個字元ascii碼的十六進製制。不過稍微有些變動,需要在前面加上「%」。比如「\」,它的ascii碼是92,92的十六進製制是5c,所以「\」的url編碼就是%5c。那麼漢字的url編碼呢?很簡單,看例子:「胡」的ascii碼是-17670,十六進製制是bafa,url編碼是「%ba%fa」

1.解釋
unicode:包括了地球上所有文化、所有字母和符號 的編碼

iso規定必須用兩個位元組,16位來統一表示所有的字元,對於ascii裡的那些「半形」字元,unicode包持其原編碼不變,只是將其長度由原來的8位擴充套件為16位,而其他文化和語言的字元則全部重新統一編碼

1.解釋
為解決unicode如何在網路上傳輸的問題,於是面向傳輸的眾多 utf(ucs transfer format)標準出現了,顧名思義,utf-8就是每次8個位傳輸資料。utf-8就是在網際網路上使用最廣的一種unicode的實現方式,這是為傳輸而設計的編碼,這樣就可以顯示全世界上所有文化的字元了。utf-8最大的乙個特點,就是它是一種變長的編碼方式。它可以使用1~4個位元組表示乙個符號,根據不同的符號而變化位元組長度,當字元在ascii碼的範圍時,就用乙個位元組表示,保留了ascii字元乙個位元組的編碼做為它的一部分,注意的是unicode乙個中文字元佔2個位元組,而utf-8乙個中文字元佔3個位元組

1.解釋
ascii 碼使用指定的7 位或8 位二進位制數組合來表示128 或256 種可能的字元。標準ascii 碼也叫基礎ascii碼,使用7 位二進位制數(剩下的1位二進位制為0)來表示所有的大寫和小寫字母,數字0 到9、標點符號, 以及在美式英語中使用的特殊控制字元。其中:

0~31及127(共33個)是控制字元或通訊專用字元(其餘為可顯示字元),如控制符:lf(換行)、cr(回車)、ff(換頁)、del(刪除)、bs(退格)、bel(響鈴)等;通訊專用字元:soh(文頭)、eot(文尾)、ack(確認)等;ascii值為8、9、10 和13 分別轉換為退格、製表、換行和回車字元。它們並沒有特定的圖形顯示,但會依不同的應用程式,而對文字顯示有不同的影響。

32~126(共95個)是字元(32是空格),其中48~57為0到9十個阿拉伯數字。

65~90為26個大寫英文本母,97~122號為26個小寫英文本母,其餘為一些標點符號、運算符號等。

同時還要注意,在標準ascii中,其最高位(b7)用作奇偶校驗位。所謂奇偶校驗,是指在**傳送過程中用來檢驗是否出現錯誤的一種方法,一般分奇校驗和偶校驗兩種。奇校驗規定:正確的**乙個位元組中1的個數必須是奇數,若非奇數,則在最高位b7添1;偶校驗規定:正確的**乙個位元組中1的個數必須是偶數,若非偶數,則在最高位b7添1。

後128個稱為擴充套件ascii碼。許多基於x86的系統都支援使用擴充套件(或「高」)ascii。擴充套件ascii 碼允許將每個字元的第8 位用於確定附加的128 個特殊符號字元、外來語字母和圖形符號

Python 各種編碼

問題 做twitter資料去停用詞的處理,遇到 unicodedecodeerror gbk codec can t decode byte 0xbf in position 2 illegal multibyte sequence 的錯誤 分析 終端預設的編碼格式是gbk當呼叫print函式將內容...

各種排序演算法彙總

各種排序演算法彙總 include include include include using namespace std template void insertsort t a,int n 直接插入排序,時間複雜度為o n 2 a j d temp 這個while實際上是直接插入排序 d 1 即...

KVM各種知識彙總

1,kvm 磁碟空間擴充套件 qemu img resize dev vg00 vm moni 2g 2,kvm宿主機多塊網絡卡,如何實現多網絡卡冗餘和負載均衡?bond0不要設定位址,ifcfg bond0 內容可以這樣 device bond0 onboot yes bootproto none...