Unicode CJK部分編碼筆記

2021-08-25 21:15:25 字數 2004 閱讀 4041

本來要帶上例子字元的,可iteye發不上,沒辦法了。

全部unicode中日韓越通用漢字字元(約76227字)。

定義            範圍                   字數

cjk基本集    [4e00-9fbb]      20924字

[9fc3-9fcb]              8字

cjk擴充套件a     [3400-4db5]       6582字

cjk擴充套件b     [20000-2a6d6] 42711字

cjk擴充套件c   [2a700-2b734]   4149字

cjk擴充套件d   [2a740-2b81d]     222字

部首擴充套件      [2e80-2ef3]        115字

康熙部首      [2f00-2fd5]        214字

ids符號       [2ff0-2ffb]          12字

cjk符號      [3000-303f]          64字

日文假名      [3040-30ff]        189字

cjk注音符號 [3105-312c]         40字

cjk筆畫       [31c0-31e3]         36字

全形符號      [ff01-ff60]           96字

cjk相容        [f900-fad9]        474字

cjk相容擴充套件  [2f800-2fa1d]    542字

pua(gbk) [e815-e864]          79字

更詳細的解釋,其實有些是保留的,目的不外乎擴容準備

中日韓字元範圍2e80~9fff

2e80~33ffh:中日韓符號區。收容康熙字典部首、中日韓輔助部首、注音符號、日本假名、韓文音符,中日韓的符號、標點、帶圈或帶括符文數字、月份,以及日本的假名組合、單位、年號、月份、日期、時間等。

3400~4dffh:中日韓認同表意文字擴充a區,總計收容6,582個中日韓漢字。

4e00~9fffh:中日韓認同表意文字區,總計收容20,902個中日韓漢字。

a000~a4ffh:彝族文字區,收容中國南方彝族文字和字根。

ac00~d7ffh:韓文拼音組合字區,收容以韓文音符拼成的文字。

f900~faffh:中日韓相容表意文字區,總計收容302個中日韓漢字。

fb00~fffdh:文字表現形式區,收容組合拉丁文本、希伯來文、阿拉伯文、中日韓直式標點、小符號、半形符號、全形符號等。

對應官方文件

標準cjk文字

全形ascii、全形中英文標點、半寬片假名、半寬平假名、半寬韓文本母:ff00-ffef

cjk部首補充:2e80-2eff

cjk標點符號:3000-303f

cjk筆劃:31c0-31ef

康熙部首:2f00-2fdf

漢字結構描述字元:2ff0-2fff

注音符號:3100-312f

注音符號(閩南語、客家語擴充套件):31a0-31bf

日文平假名:3040-309f

日文片假名:30a0-30ff

日文片假名拼音擴充套件:31f0-31ff

韓文拼音:ac00-d7af

韓文本母:1100-11ff

韓文相容字母:3130-318f

太玄經符號:1d300-1d35f

易經六十四卦象:4dc0-4dff

彝文音節:a000-a48f

彝文部首:a490-a4cf

盲文符號:2800-28ff

cjk字母及月份:3200-32ff

cjk特殊符號(日期合併):3300-33ff

裝飾符號(非cjk專用):2700-27bf

雜項符號(非cjk專用):2600-26ff

中文豎排標點:fe10-fe1f

cjk相容符號(豎排變體、下劃線、頓號):fe30-fe4f

58筆部分試題 前端

一 jquery中domready和window.onload的區別 window.onload事件要求網頁中的所有元素載入完畢後才會執行,包含很多 flash等富 載入時間很長,初始化的操作拖延很久。domready事件只判斷頁面內所有的dom節點是否已經全部載入完,至於節點的內容是否載入完並不關...

用友2014 9 24筆試題(部分)

1 地上插了若干根旗桿,已知旗桿的高度在1至5公尺之間,且任意兩根旗桿的距離都不超過他們高度差的10倍。如果用一根繩子將所有旗桿都圍進去,在不知旗桿數量和位置的情況下,最少需要準備多少公尺長的繩子?a.40 b.60 c.80 d.100答案 c解析 旗桿最高為5公尺,最矮為1公尺。因此任意兩旗桿間...

演算法練習 五筆編碼

五筆的編碼範圍是a y的25個字母,從1位到4位的編碼,如果我們把五筆的編碼按字典序排序,形成乙個陣列如下 a,aa,aaa,aaaa,aaab,aaac,b,ba,baa,baaa,baab,baac yyyw,yyyx,yyyy,其中a的index為0,aa的index為1,aaa的index為...