CSS字元編碼引起亂碼

2021-09-30 15:17:22 字數 2618 閱讀 9276

亂碼引起的css失效原理:

由於乙個中文是兩個字元組成,在編碼不一致的情況下會引發字元的「重新」組合,(半個漢字的編碼字元與後面的字元組合生成新的「文字」)引發原本的結束符合「變異」,從而導致找不到結束符號,使得後面的css就會失效。

小技巧1:css**現的亂碼都是由於css字元編碼與頁面的字元編碼不一致所引起的,因此最直接的方法就是使字元編碼一致。將css指定編碼型別,例:@charset "utf-8";(指定編碼型別為utf-8,須寫在css檔案第一行)

小技巧2:css**現的亂碼都是由於中文字元引發的,因此只要不寫中文,就不會產生「亂碼引起css失效」的這種情況

撇開以上兩種小技巧,我們在刨下根,就會發現「亂碼」通常來自以下兩種情況。

一、中文注釋引起亂碼

css注釋為:/*某些注釋*/

亂碼例項:

正常**:/*三漢字*/

引起的亂碼:/*涓夋眽瀛?/

瀏覽器環境:ie6

html:gb2312

css:無編碼指定,實際解析為utf-8

上例為亂碼阻斷了css注釋的結束符,使得後面的css內容都在注釋範圍內,從而導致css的失效

防範措施:加強注釋

示例:正常**:/****三漢字****/

引起的亂碼:/****涓夋眽瀛?***/

這種增強版的注釋可以防止亂碼把注釋的最終結束符「變異」,可以在編寫css時,提前防範

二、中文字型引起亂碼

css指定字型:font-family:"中文字型";

亂碼例項:

正常**:font-family:"黑體"

引起的亂碼:font-family:"榛戜綋"

瀏覽器環境:ie6

html:gb2312

css:無編碼指定,實際解析為utf-8

上例為亂碼使得字型名稱變成亂碼,導致指定字型失效。這個問題的後果似乎不是很嚴重,但實際情況中,確實存在一種亂碼把後面的引號「變異」的情況,使得後面的css都在字型的引號中,從而後面的css全部失效。

防範措施:採用字型的別名(所以瀏覽器都可識別)

示例:正常**:font-family:"simhei" (font-family:"\9ed1\4f53" )

瀏覽器解析:font-family:"simhei" (font-family:"黑體",ie6仍為font-family:"\9ed1\4f53" 但字型解析顯示為黑體)

使用別名,繞開了使用中文,從而避免亂碼

css中文字型(font-family)列表

windows的一些:

黑體:simhei

宋體:simsun

新宋體:nsimsun

仿宋:fangsong

楷體:kaiti

仿宋_gb2312:fangsong_gb2312

楷體_gb2312:kaiti_gb2312

微軟雅黑體:microsoft yahei

裝office會生出來的一些:

隸書:lisu

幼圓:youyuan

華文細黑:stxihei

華文楷體:stkaiti

華文宋體:stsong

華文中宋:stzhongsong

華文仿宋:stfangsong

方正舒體:fzshuti

方正姚體:fzyaoti

華文彩雲:stcaiyun

華文琥珀:sthupo

華文隸書:stliti

華文行楷:stxingkai

華文新魏:stxinwei

補充:使用楷體_gb2312、仿宋_gb2312後,在 windows 7/vista/2008 中可能不再顯示為對應的字型。

這是因為 windows 7/vista/2008 中有楷體、仿宋,預設情況下沒有楷體_gb2312、仿宋_gb2312,字型名稱相差「_gb2312」。

中文字型在 css 中的寫法

針對字型的寫法,覺得需要說明一下:

body,

button, input, select, textarea {

font: 12px/1 tahoma, helvetica, arial, "\5b8b\4f53", sans-serif;

「\5b8b\4f53″ 就是 「宋體」。用 unicode 表示,不用 simsun, 是因為 firefox 的某些版本和 opera 不支援 simsun 的寫法。普及點字型知識:

字型的別名

系統中的乙個字型是允許有多種別名形式存在的。比如,在 windows 下,georgia 也可以用 georgia ms 來命名,它們其實是同一種字型。宋體的正式名稱是 simsun,而「宋體」只是它的別名。

按照規範,瀏覽器應該能自動識別字型的別名,並對映到正確的字型檔案。比如,font-famliy: simsun和font-family: "宋體"應該具有等價的效果。可惜,似乎很多瀏覽器都不能正確執行前一條定義……

因此,考慮瀏覽器相容,我們需要用「宋體」,轉碼成 unicode 形式則可以保證在任何編碼下都無問題。

為了方便需要的朋友快速使用,下表中列出了一些常用中文字型的unicode編碼:

黑體 \9ed1\4f53

宋體 \5b8b\4f53

楷體 \6977\4f53

微軟雅黑 \5fae\8f6f\96c5\9ed1

CSS字元編碼引起亂碼

亂碼引起的css失效原理 由於乙個中文是兩個字元組成,在編碼不一致的情況下會引發字元的 重新 組合,半個漢字的編碼字元與後面的字元組合生成新的 文字 引發原本的結束符合 變異 從而導致找不到結束符號,使得後面的css就會失效。小技巧1 css中出現的亂碼都是由於css字元編碼與頁面的字元編碼不一致所...

字元編碼亂碼處理

python3預設編碼是unicode 而python2是ascii碼。windows環境預設是gbk編碼。1.python直譯器的預設編碼 2.python原始檔檔案編碼 3.terminal使用的編碼 4.作業系統的語言設定 一 編碼的種類 i ascii 佔1個位元組,只支援英文 ii gb2...

Qt 字元編碼 亂碼總結

cpp view plain copy qtextcodec setcodecforcstrings qtextcodec codecforname utf 8 qtextcodec setcodecforlocale qtextcodec codecforname utf 8 qtextcodec...