AIX 中文字符集及環境變數設定

2021-09-26 08:08:40 字數 836 閱讀 4878

中文字符集介紹:

gb2313包括6763個漢字

gbk收錄了20902個漢字

gb18030收錄了27484個漢字

200.31.138.173

總結:gb2312=ascii+常用漢字+符號

gbk=gb2312+不常用字(含big5繁體漢字)+圖形符號

gb18030=gbk+ext-a+圖形符號

unicode=gb18030+ext-b+……(如未發布的ext-c及其它國家文字)

注意:unicode的漢字編碼與前三者不一樣,utf-8是unicode的實現方式之一。

aix系統中:

aix的中文漢字型檔中,zh_cn 中有6763個漢字,而zh_cn中有20902個漢字。如果使用者要用到一些比較偏僻的漢字,建議使用者安裝中文環境時選擇zh_cn。

gbk的意思是 guo (national) biao (standard) kuo (extension).

gb18030 將國家標準定義進行了擴充套件,包含 20902 個漢字, 它定義了所有 dbcs 字元以及中國大陸及台灣地區使用的符號

注:aix中各字符集的區別在於zh_cn的大小寫。

常用命令:

檢視已經安裝的字符集

locale -a

注:"c"是系統預設的locale,"posix"是"c"的別名。所以當我們新安裝完乙個系統時,預設的locale就是c或posix

檢視當前系統使用的字符集

env | grep lang 或者 locale

修改整個系統的字符集

vi /etc/environment --> lang=zh_cn

修改單個使用者的字符集

設定中文字符集

目錄 二 漢字的編碼 三 設定linux的字符集 四 lang環境變數 五 修改客戶端的字符集 六 字符集轉換工具 七 應用經驗 字元編碼是一種法則,在數字與符號之間建立的對應關係。不同的國家有不同的語言,包含的文字 標點符號 圖形符號各有不同。例如在ascii編碼中,用數字97表達字元 a 與字符...

中文字符集

gb2312 1980年 16位字符集,收錄有6763個簡體漢字,682個符號,共7445個字元。優點 適用於簡體中文環境,屬於中國國家標準,通行於大陸,新加坡等地也使用此編碼 缺點 不相容正體中文,其漢字集合過少。gbk 1995年 16位字符集,收錄有21003個漢字,883個符號,共21886...

給aix 系統增加中文字符集

最近客戶反映,在run oracle 的時候,有中文顯示不出來,討論了一下,可能沒有安裝中文字元。我去support locale a 發現沒有utf8 安裝步驟 step1 smit lang step2 language mangement step3 add additional langua...