位元組順序標記BOM

最近，從numbers匯出的csv檔案，匯入excel後，出現中文亂碼問題。網上查詢後，發現是numbers匯出的csv預設是utf-8無bom的，使用sublimtext3開啟，另存為utf-8withbom格式，再使用excel開啟，就可以正常識別中文。那麼，今天就來回顧一下bom吧～

big-endian和little endian是cpu處理多位元組數的不同方式。例如「漢」字的unicode編碼是6c49。那麼寫到檔案裡時，究竟是將6c寫在前面，還是將49寫在前面？如果將6c寫在前面，就是big-endian。如果將49寫在前面，就是little- endian。

bom（byte order mark）位元組順序標記，出現在文字檔案頭部，unicode編碼標準中用於標識檔案是採用哪種格式的編碼。

utf-8以位元組為編碼單元，沒有位元組序的問題。但是可以使用bom來表明編碼方式，字元"zero width no-break space"的utf-8編碼是ef bb bf。所以如果接收者收到以ef bb bf開頭的位元組流，就知道這是utf-8編碼。windows的筆記本軟體、excel就是使用bom來識別utf-8.

更多專業前端知識，請上

【猿2048】www.mk2048.com

位元組順序標記BOM

BOM 位元組序標記

位元組順序標記（ByteOrderMark）BOM

ANSI UNICODE UTF 位元組序 BOM

位元組順序標記BOM

BOM 位元組序標記

位元組順序標記（ByteOrderMark）BOM

ANSI UNICODE UTF 位元組序 BOM

相關推薦