正確理解和使用GBK及UTF 8編碼

2021-06-25 10:01:54 字數 826 閱讀 7110



網頁編碼英文譯為web page encoding,是在網頁中指定其特定的字元編碼格式的庫。

gbk是國家標準gb2312基礎上擴容後相容gb2312的標準。gbk的文字編碼是用雙位元組來表示的,即不論中、英文本元均使用雙位元組來表示,為了區分中文,將其最高位都設定成1。gbk包含全部中文字元,是國家編碼,通用性比utf8差,不過utf8占用的資料庫比gbk大。

utf-8版本雖然具有良好的國際相容性,但中文需要比gbk/big5版本多占用50%的資料庫儲存空間,因此並非推薦使用,僅供對國際相容性有特殊要求的使用者使用。簡單地說:對於中文較多的**,適宜用gbk編碼節省資料庫空間。對於英文較多的**,適宜用utf-8節省資料庫空間。

gbk、gb2312等與utf8如何轉換?gbk、gb2312等與utf8之間都必須通過unicode編碼才能相互轉換:gbk、gb2312——unicode——utf8;utf8——unicode——gbk、gb2312。使用windows記事本的「另存為」,可以在gbk、unicode、unicode big endian和utf-8這幾種編碼方式間相互轉換。

如何讓瀏覽器正確識別網頁編碼?一般在網頁中都要有如下一句,指示此網頁的字符集編碼是gb2312。(或者utf-8)

的內容時,如果在前有奇數個全形字符,ie把utf-8當作兩個位元組解析時出現半個漢字的情況,這時該半個漢字會和的《結合成乙個亂碼字,導致ie無法讀完部分,使整個頁面為空百輸出,而這個時候如果察看原始檔的話,會發現實際上整個頁面全部已經輸出了,但瀏覽器不顯示內容。最簡單的解決辦法是把放在之前。

UTF 8和GBK的區別

utf 8和gbk的區別 2009年06月09日 星期二 下午 02 00 gbk是國家標準gb2312基礎上擴容後相容gb2312的標準。gbk的文字編碼是用雙位元組來表示的,即不論中 英文本元均使用雙位元組來表示,為了區分中文,將其最高位都設定成1。gbk包含全部中文字元,是國家編碼,通用性比u...

GBK和UTF8的區別

gbk和utf8的區別 gbk編碼 是指中國的中文字元,其它它包含了簡體中文與正體中文本元,另外還有一種字元 gb2312 這種字元僅能儲存簡體中文本元。utf 8編碼 它是一種全國家通過的一種編碼,如果你的 涉及到多個國家的語言,那麼建議你選擇utf 8編碼。gbk和utf8有什麼區別?utf8編...

GBK和UTF 8的區別

我們這裡將以最簡單最容易理解的方式來描述gbk和utf8的區別,以及它們分別是什麼。gbk編碼 是指中國的中文字元,其它它包含了簡體中文與正體中文本元,另外還有一種字元 gb2312 這種字元僅能儲存簡體中文本元。utf8編碼格式很強大,支援所有國家的語言,正是因為它的強大,才會導致它占用的空間大小...