linux下utf 8 BOM的檢查和刪除

2021-10-20 07:17:46 字數 418 閱讀 6753

參考:

當源程式是gbk格式,你轉換為 utf8 的時候,很多情況是頭部會出現bom,當是php 程式時候,這樣會出現很多意想不到的事情,那怎麼辦呢,你可以用linux 命令來查詢,然後對檔案的bom 進行刪除

grep -r $』\xef\xbb\xbf』 * |grep .php
bom:utf-8簽名(utf-8 signature)也叫做bom(byte order mark)

1. 用vim去除utf-8 bom

去掉utf-8 bom

:set nobomb
保留utf-8 bom

:set bomb
2.查詢並替換掉

find . -type f -exec sed -i 's/\xef\xbb\xbf//' {} \;

Linux下utf 8 BOM 的檢查和刪除

1 當源程式是gb格式,你轉換為 utf8 的時候,很多情況是頭部會出現bom,當是php 程式時候,這樣會出現很多意想不到的事情,那怎麼辦呢,你可以用linux 命令來查詢,然後對檔案的bom 進行刪除,就ok 了 grep r xefxbbxbf grep php bom utf 8簽名 utf...

UTF8 bom問題的研究

當儲存文字檔案為utf 8 bom時,在內容的開頭會多出3個位元組 ef bb bf 它是用來標示這個文件就是utf 8編碼的文件,可以防止文字編輯器編碼解發布錯。但是多出來的3個位元組也會惹些麻煩。例如 session start 在session cookie使用前,不能有任何輸出,空行空格都不...

utf 8與utf 8 bom的區別

在utf 8編碼檔案中bom在檔案頭部,占用三個位元組,用來標識該檔案屬於utf 8編碼,現在已經有很多軟體識別bom頭,但還是有些不能識別bom頭,比如php就不能識別bom頭,這也就是用記事本編輯utf 8編碼的php檔案後,就會報錯的原因。在windows環境下,用記事本開啟任何乙個文字檔案,...