lamp字元編碼的轉換規則

2022-07-30 04:36:16 字數 1283 閱讀 3798

1.lamp字元編碼的轉換規則

lamp(linux+apache+mysql+php)

1.1gb 2312

gb 2312 或 gb 2312-80 是中國國家標準簡體中文字符集,全稱《資訊交換用漢字編碼字符集·基本集》,又稱 gb 0,由中國國家標準總局發布,1981 年 5 月 1 日實施。gb 2312 編碼通行於中國大陸;新加坡等地也採用此編碼。中國大陸幾乎所有的中文系統和國際化的軟體都支援 gb 2312。

gb 2312 標準共收錄 6763 個漢字,其中一級漢字 3755 個,二級漢字 3008 個;同時收錄了包括拉丁字母、希臘字母、日文平假名及片假名字母、俄語西里爾字母在內的 682 個字元。

gb 2312 對任意乙個圖形字元都採用兩個位元組表示,並對所收漢字進行了「分割槽」處理,每區含有 94 個漢字/符號,分別對應第一位元組和第二位元組。這種表示方式也稱為區位碼。

10-15 區及 88-94 區則未有編碼。gb 2312 的編碼範圍為 2121h-777eh,與 ascii 有重疊,通行方法是將 gb 碼兩個位元組的最高位置 1 以示區別。

1.2gbk

gbk漢字內碼擴充套件規範k為漢語拼音 kuo zhan(擴充套件)中「擴」字的聲母。英文全稱 chinese internal code specification。

gbk 共收入 21886 個漢字和圖形符號,包括:

gbk 向下與 gb 2312 完全相容,向上支援 iso 10646 國際標準,在前者向後者過渡過程中起到的承上啟下的作用。

gbk 採用雙位元組表示,總體編碼範圍為 8140-fefe 之間,首位元組在 81-fe 之間,尾位元組在 40-fe 之間,剔除 xx7f 一條線。gbk 編碼區分三部分:

gbk/2:oxboa1-f7fe, 收錄 gb 2312 漢字 6763 個,按原序排列;

gbk/3:ox8140-aofe,收錄 cjk 漢字 6080 個;

gbk/4:oxaa40-feao,收錄 cjk 漢字和增補的漢字 8160 個。

gbk/1:oxa1a1-a9fe,除 gb 2312 的符號外,還增補了其它符號

gbk/5:oxa840-a9ao,擴除非漢字區。

gbk 區域中的空白區,使用者可以自己定義字元。

lamp字元編碼的轉換規則

1.lamp字元編碼的轉換規則 lamp linux apache mysql php 1.1gb 2312 gb 2312 或 gb 2312 80 是中國國家標準簡體中文字符集,全稱 資訊交換用漢字編碼字符集 基本集 又稱 gb 0,由中國國家標準總局發布,1981 年 5 月 1 日實施。gb...

指定域轉換規則

11.2.2.2.指定域轉換規則 現在看第8和第9行,這裡出現了兩次呼叫domain auto trans 巨集,這個巨集可能是strict示例策略中最常用的乙個巨集了,因為它定義了我們在第2章 概念 中討論到的允許域轉換的標準規則,你可以在.macros core macros.te檔案找到這個巨...

js數值轉換規則

如果是物件,則呼叫valueof 方法按照前述規則繼續轉化,若結果為nan,則呼叫物件的tostring 方法,再按照前面的規則轉換返回的字串 parseint 處理字串時會忽略字串前面的空格,若遇到第乙個字元不是數字或符號,則返回nan 如果是數字,則會解析直到所有字串或遇到非數字字元。會識別十六...