ISO 8859 語言字符集詳解

2021-05-10 05:40:47 字數 1014 閱讀 6302

iso/iec 8859-1,又稱latin-1或「西歐語言」,是國際標準化組織內iso/iec 8859的第乙個8位字符集。它以ascii為基礎,在空置的0xa0-0xff的範圍內,加入192個字母及符號,藉以供使用變音符號的拉丁字母語言使用。

此字符集支援部分於歐洲使用的語言,包括阿爾巴尼亞語、巴斯克語、布列塔尼語、加泰隆尼亞語、丹麥語、荷蘭語、法羅語、弗里西語、加利西亞語、德語、格陵蘭語、冰島語、愛爾蘭蓋爾語、義大利語、拉丁語、盧森堡語、挪威語、葡萄牙語、裡托羅曼斯語、蘇格蘭蓋爾語、西班牙語及瑞典語。

英語雖然沒有重音字母,但仍會標明為iso 8859-1編碼。除此之外,歐洲以外的部分語言,如南非荷蘭語、斯瓦希里語、印尼語及馬來語、菲律賓他加洛語等也可使用iso 8859-1編碼。

法語及芬蘭語本來也使用iso 8859-1來表示。但因它沒有法語使用的 œ、œ、 ÿ 三個字母及芬蘭語使用的 š、š、ž、ž ,故於2023年被iso/iec 8859-15所取代。(iso 8859-15同時加入了歐元符號)

iso/iec 8859-2 latin-2或「中歐語言」,是國際標準化組織內iso/iec 8859的其中乙個8位字符集

iso/iec 8859-3 南歐語言字符集

iso/iec 8859-4 北歐語言字符集

iso/iec 8859-5 是國際標準化組織內iso/iec 8859的其中乙個8位字符集。此字集收錄西里爾字母,供俄語、白俄羅斯語、保加利亞語、馬其頓語、塞爾維亞語、烏克蘭語使用。(哈薩克語及蒙古語儘管不是斯拉夫文字,但也使用西里爾字母書寫)

iso/iec 8859-6 供現代阿拉伯語使用

iso/iec 8859-7 供現代希臘語使用

iso/iec 8859-8 供希伯來語使用

iso/iec 8859-9 是國際標準化組織內iso/iec 8859的其中乙個8位字符集。它主要用以表示土耳其語及庫爾德語文本。

這個字符集由iso/iec 8859-1演化而來,它把原屬冰島語的 ð、ð、ý、ý、þ、þ 字母移走,換上 ğ、ğ、i̇、ı、ş、ş 六個土耳其語字母。

mysql字符集詳解 MySQL字符集詳解

在資料庫中,字元亂碼屬於常見 多發問題。鑑於本人水平頂多只能歸於不入流之類,寫這篇文章時內心誠惶誠恐,實在擔心誤導大家。內容僅供參考,若有錯誤,請各位及時指出,我也好學習提高!mysql的字符集有4種級別的設定,分別是 伺服器級 資料庫級 表級 字段級。一 伺服器級字符集 1 可以在my.cnf中設...

字符集詳解

iso 8859 1是對ascii的擴充套件,簡體中文的編碼gb2312,ascii占用乙個位元組,但是只用到了八位中的後七位,第一位預設為0,iso 8859 1則是在ascii的基礎上擴充套件了第一位,並相容ascii,而unicode是定長編碼 定長編碼對於計算機而言處理速度相對較快 使用兩個...

字符集和字符集編碼詳解

gb2312 gbk ascii asni unicode utf 8等等,這些字眼非常常見,同時帶來許多的問題。本文只是從理解的角度,說明以上內容的不同含義從而達到區分其用法的目的是夠了的。至於實現方式,可以查閱各自的詳細標準官方文件。先解釋乙個概念,什麼是字符集,嗯,不解釋了,我弄乙個吧 從今以...