unicode 字元範圍

2022-04-03 19:28:40 字數 1296 閱讀 6452

1)標準cjk文字

code point range

block name

release

u+3400..u+4db5

cjk unified ideographs extension a

3.0u+4e00..u+9fa5

cjk unified ideographs

1.1u+9fa6..u+9fbb

cjk unified ideographs

4.1u+f900..u+fa2d

cjk compatibility ideographs

1.1u+fa30..u+fa6a

cjk compatibility ideographs

3.2u+fa70..u+fad9

cjk compatibility ideographs

4.1u+20000..u+2a6d6

cjk unified ideographs extension b

3.1u+2f800..u+2fa1d

cjk compatibility supplement

3.12)全形ascii、全形中英文標點、半寬片假名、半寬平假名、半寬韓文本母:ff00-ffef

3)cjk部首補充:2e80-2eff

4)cjk標點符號:3000-303f

5)cjk筆劃:31c0-31ef

6)康熙部首:2f00-2fdf

7)漢字結構描述字元:2ff0-2fff

8)注音符號:3100-312f

9)注音符號(閩南語、客家語擴充套件):31a0-31bf

10)日文平假名:3040-309f

11)日文片假名:30a0-30ff

12)日文片假名拼音擴充套件:31f0-31ff

13)韓文拼音:ac00-d7af

14)韓文本母:1100-11ff

15)韓文相容字母:3130-318f

16)太玄經符號:1d300-1d35f

17)易經六十四卦象:4dc0-4dff

18)彝文音節:a000-a48f

19)彝文部首:a490-a4cf

20)盲文符號:2800-28ff

21)cjk字母及月份:3200-32ff

22)cjk特殊符號(日期合併):3300-33ff

23)裝飾符號(非cjk專用):2700-27bf

24)雜項符號(非cjk專用):2600-26ff

25)中文豎排標點:fe10-fe1f

26)cjk相容符號(豎排變體、下劃線、頓號):fe30-fe4f

unicode中文範圍

在網上搜尋了一下漢字的unicode範圍,普遍給出了 u 4e00.u 9fa5 但事實上這個範圍是不完整的,甚至連基本的全形 中文 標點也未包含在內。根據最新的unicode 5.0版整理如下 注 在絕大多數應用場合中,我們可以僅用 1 2 3 4 5 的集合作為cjk判斷的依據。1 標準cjk文...

漢字unicode編碼範圍

gb2312編碼 1981年5月1日發布的簡體中文漢字編碼國家標準。gb2312對漢字採用雙位元組編碼,收錄7445個圖形字元,其中包括6763個漢字。big5編碼 台灣地區正體中文標準字符集,採用雙位元組編碼,共收錄13053個中文字,1984年實施。gbk編碼 1995年12月發布的漢字編碼國家...

漢字unicode編碼範圍

gb2312編碼 1981年5月1日發布的簡體中文漢字編碼國家標準。gb2312對漢字採用雙位元組編碼,收錄7445個圖形字元,其中包括6763個漢字。big5編碼 台灣地區正體中文標準字符集,採用雙位元組編碼,共收錄13053個中文字,1984年實施。gbk編碼 1995年12月發布的漢字編碼國家...