為什麼亂碼 前的非ANSI字元

2021-09-06 04:48:07 字數 1465 閱讀 2620

2011/12/31

瀏覽器的網頁字符集檢測順序通常是:

註解一:http content-type header如果指定了 charset的話,優先順序高於 html文件裡中的charset宣告

註解二:如果http content-type header沒有指定 charset ,而html文件的之前有非ansi字元,有可能此meta標籤就不會解析,切記,2023年的blogger.com就曾出現過此問題。如下圖所示,此meta標籤保持在title之前是個好習慣,但下圖中的綠色字型中文注釋會導致部分瀏覽器不再繼續檢測字符集:

註解三:第二步後,如果還沒有明確指定字符集,那麼瀏覽器就暫時採用預設字符集。如ie中文版的預設值是gb2312,firefox中文版的預設值是gbk。

一些瀏覽器(如ie核心低版本瀏覽器)因meta之前有中文導致無法解析,會用預設字符集gb2312來解析該網頁,於是渲染之後你看到的就是這種亂碼:

即,當你能看到明顯是亂碼的漢字或方塊字排列,八成是瀏覽器把utf-8文件當成gb2312解析了。

我的推特流:

1、《網曝3家銀行過億使用者資料洩露》——人們很快發現**使用者密碼洩漏有助於喚醒休眠使用者,開心啊,年終總結報告這下好寫了。

2、張俊林博士的新書《這就是搜尋引擎:核心技術詳解 》,亞馬遜**39.60元,光看目錄就讓人眼饞,不同緯度的n多演算法。比如第6章的鏈結分析。

3、說個段子,n年前的一天,我坐俊林旁邊辦公,想查一下現在主流的文章去重演算法有哪些,於是google了一把,翻了若干文獻後,突然看到一篇極精彩的,深入淺出,評語精妙,心想:人才啊,趕緊看看這誰寫的...翻到最後,原來是張俊林。

4、贈圖1枚:

為什麼專案驗收前的總是非常忙亂?

專案驗收標誌著專案實施的結束,是專案組日夜奮戰 夢寐以求的成果,專案驗收的喜悅不亞於專案簽單。遺憾的是,每到臨近專案驗收,專案組總是忙得不可開交,大量的工作好像突然間都冒了出來,尤以文件工作為最。專案執行過程中,因為各種原因,專案組總是傾向於客戶 領導看得見摸得著的工作內容,如同程式設計師寫 每天都...

為什麼進行資料恢復後的檔案是亂碼

資料恢復軟體是按照不同型別的刪除檔案型別進行資料恢復,軟體會將磁碟上所有疑似有刪除標誌的檔案提取出來,並形成不同的型別檔案,以供使用者挑選 提取,再進一步恢復,一般情況下丟失的資料通過以上方法都是可以找回的。那麼,為什麼將刪除的檔案恢復之後,還會有亂碼的情況出現?檔案亂碼,一般都是由於檔案自身損壞,...

C 什麼是轉義字元!字串前的 符號的作用!

轉義字元,又稱資料傳送換碼字元 通訊控制用 以反斜線 開頭,後跟乙個或幾個字元 具有特定的含義,不同於字元原有的意義,故稱 轉義 字元 主要用來表示那些用一般字元不便於表示的控制 它的作用是消除緊隨其後的字元的原有含義 用一些普通字元的組合來代替一些特殊字元,由於其組合改變了原來字元表示的含義,因此...