Linux下utf 8 BOM 的檢查和刪除

2021-06-18 22:05:40 字數 443 閱讀 4984

1、當源程式是gb格式,你轉換為 utf8 的時候,很多情況是頭部會出現bom,當是php 程式時候,

這樣會出現很多意想不到的事情,那怎麼辦呢,你可以用linux 命令來查詢,然後對檔案的bom 進行刪除,就ok 了

grep -r $』xefxbbxbf』 * |grep .php

bom:utf-8簽名(utf-8 signature)也叫做bom(byte order mark)

用vim去除utf-8 bom

1.』去掉utf-8 bom

:set nobomb

2.』保留utf-8 bom

:set bomb

目的就是為了能夠相容用記事本編輯的 檔案,不需要的話可以去掉。vim在儲存utf-8編碼的檔案時會去掉bom。

去掉bom的最大好處是在unix下能夠使用cat a b>c來正確合併檔案,這點經常被忽略。

linux下utf 8 BOM的檢查和刪除

參考 當源程式是gbk格式,你轉換為 utf8 的時候,很多情況是頭部會出現bom,當是php 程式時候,這樣會出現很多意想不到的事情,那怎麼辦呢,你可以用linux 命令來查詢,然後對檔案的bom 進行刪除 grep r xef xbb xbf grep phpbom utf 8簽名 utf 8 ...

UTF8 bom問題的研究

當儲存文字檔案為utf 8 bom時,在內容的開頭會多出3個位元組 ef bb bf 它是用來標示這個文件就是utf 8編碼的文件,可以防止文字編輯器編碼解發布錯。但是多出來的3個位元組也會惹些麻煩。例如 session start 在session cookie使用前,不能有任何輸出,空行空格都不...

utf 8與utf 8 bom的區別

在utf 8編碼檔案中bom在檔案頭部,占用三個位元組,用來標識該檔案屬於utf 8編碼,現在已經有很多軟體識別bom頭,但還是有些不能識別bom頭,比如php就不能識別bom頭,這也就是用記事本編輯utf 8編碼的php檔案後,就會報錯的原因。在windows環境下,用記事本開啟任何乙個文字檔案,...