文字檔案編碼問題的乙個坑

2022-08-21 14:57:16 字數 532 閱讀 5916

事件起因:在我用socket練習http響應時,網頁顯示英文是亂碼

處理:1、將網頁檔案用txt開啟,另存為時改編碼為utf-8,結果網頁一直無法顯示了

2、新建乙個html文件就可以正常顯示,懷疑html文件問題

3、對改了編碼的文件進行研究發現,改成utf-8後文件開頭多了乙個「-」特殊符號,造成html**解析異常,無法顯示

最終處理:

當**編輯器編輯html文件時,有中文,html自己就是utf-8,所以不要在txt中改html的編碼方式

總結一句:不要輕易的用txt編輯器來改編碼格式

判斷乙個文字檔案的編碼格式

不同編碼的文字,是根據文字的前兩個位元組來定義其編碼格式的。定義如下 ansi 無格式定義 unicode 前兩個位元組為fffe unicode big endian 前兩位元組為feff utf 8 前兩位元組為efbb 檔案的字符集在windows下有兩種,一種是ansi,一種unicode。...

判斷乙個文字檔案的編碼格式

檔案的字符集在windows下有兩種,一種是ansi,一種unicode。對於unicode,windows支援了它的三種編碼方式,一種是小尾編碼 unicode 一種是大尾編碼 bigendianunicode 一種是utf 8編碼。我們可以從檔案的頭部來區分乙個檔案是屬於哪種編碼。當頭部開始的兩...

判斷乙個文字檔案的編碼格式

檔案的字符集在windows下有兩種,一種是ansi,一種unicode。對於unicode,windows支援了它的三種編碼方式,一種是小尾編碼 unicode 一種是大尾編碼 bigendianunicode 一種是utf 8編碼。我們可以從檔案的頭部來區分乙個檔案是屬於哪種編碼。當頭部開始的兩...