如何識別一些常見的編碼形式

2021-07-09 05:55:04 字數 1016 閱讀 1219

url 編碼

url編碼就是乙個字元ascii碼的十六進製制。

不過稍微有些變動,需要在前面加上「%」。

比如「\」,它的ascii碼是92,92的十六進製制是5c,所以「\」的url編碼就是%5c。那麼漢字的url編碼呢?

很簡單,看例子:「胡」的ascii碼是-17670,十六進製制是bafa,url編碼是「%ba%fa」。

規律就是從%00 到%ff (十六進製制範圍)

unicode 中文編碼 特徵就是\u 開頭

這裡給乙個轉換的鏈結吧……

\u4e2d\u6587

中國 utf-8 0xe4 0xb8 0xad 0xe5 0x9b 0xbd

gbk編碼,乙個漢字佔兩個位元組。《漢字內碼擴充套件規範》

中國 gbk 0xd6 0xd0 0xb9 0xfa

形如——

&#dddd;

&#xhhhh;

&#name;

——的一串字元是 html、xml 等 sgml 類語言的轉義序列(escape sequence)。它們不是「編碼」。

以 html 為例,這三種轉義序列都稱作 character reference:

前兩種是 numeric character reference(ncr 數字字元引用),數字取值為目標字元的 unicode code point;以「&#」開頭的後接十進位制數字,以「&#x」開頭的後接十六進製制數字。

後一種是 character entity reference,後接預先定義的 entity 名稱,而 entity 宣告了自身指代的字元。

從 html 4 開始,ncr 以 unicode 為準,與文件編碼無關。

「中國」二字分別是 unicode 字元 u+4e2d 和 u+56fd,十六進製制表示的 code point 數值「4e2d」和「56fd」就是十進位制的「20013」和「22269」。所以——

中國

中國

常見的一些編碼

對於密碼學來說編碼並不是密碼,但也是很常見的使用了,因此在這裡簡單的總結一下各種編碼。1.ascii 對於ascii來說其前1 31為非列印字元,後面的才是列印字元。可以說是用的很廣泛的一種一種編碼了。例如在sql注入中我們都會經常遇到他,在各種語言中都會遇到為其設定的函式,等等。廢話不說上圖 可以...

一些編碼規範

先判斷是否為空list null list.size 0提示條件裡不要有感嘆號!客戶很反感。字串加trim 判斷。去掉前邊的空格。儘量減少對變數的重複計算 明確乙個概念,對方法的呼叫,即使方法中只有一句語句,也是有消耗的,包括建立棧幀 呼叫方法時保護現場 呼叫方法完畢時恢復現場等。所以例如下面的操作...

reload 命令的一些常用形式

reload f 命令會強制debugger立即解析所有module相關聯的符號檔案.於是我就想,有沒有什麼命令可以立即去掉所有module相關聯的符號檔案呢?找了半天也沒找到,最後發現.reload f的反命令就是.reload 其他形式 reload reload f 強制偵錯程式立刻載入並且解...