linux環境下檢視文字編碼及編碼轉換

2021-08-28 15:29:44 字數 1105 閱讀 1968

linux下讀取windows下產生的文字檔案,或者由某些linux系統上執行的應用產生的文字檔案(日誌等),放在其他系統或者應用使用時,經常可能出現亂碼。這主要是文字編碼不同而造成的。

1、linux命令: file filename

file命令給出的檔案格式常常不是很清晰。

2、vim命令:vim filename

:set fileencoding

可看到當前檔案編碼格式

3、enca命令: enca filename

即可顯示檔案編碼資訊。(enca具體使用根據環境可能需要安裝)

轉換文字編碼的幾種方式:

1、在linux環境下,可以用iconv命令來轉換文字的編碼。

iconv 是乙個檔案編碼轉換工具,其基本用法為:

iconv -f 原始編碼 -t 目的編碼 要轉換的檔案 -o 已轉換的檔案

例如:將test.txt 檔案從 gb2312 轉換為 utf-8 編碼,並輸出為 converted.txt 檔案,.

linux下執行命令:

iconv -f gb2312 -t utf-8 test.txt -o converted.txt

使用 -l 選項檢視支援的編碼列表:

iconv -l

2、使用enconv轉換文字編碼

使用方法:

enconv -l zh_cn -x utf-8  filename

enconv可以自動判斷文字編碼和系統使用的編碼,並把文字的編碼轉換為系統編碼,可以批量轉換。

3、使用vim編輯命令

vim filename

在vim中直接進行轉換檔案編碼,比如將乙個檔案轉換成utf-8格式

:set fileencoding=utf-8

檔名編碼的轉換:

1、convmv命令:

convmv -f 轉換前編碼 -t 轉換後編碼 filename## -r 選項遞迴轉換目錄下所有子目錄中的檔名

convmv -f gbk -t utf-8 *.txt ##可看到轉換前後的對比

convmv -f gbk -t utf-8  --notest *.txt ##直接進行轉換

===需要安裝convmv的rpm包

linux下檢視檔案編碼及修改編碼

通常來說,windows中預設的檔案格式是gbk gb2312 而linux一般都是utf 8,所以linux下開啟windows的檔案會有亂碼的情況。另外,有時要將檔案進行編碼轉換,如將簡體中文轉換為正體中文。vim中查詢修改檔案編碼格式 set fileencoding 檢視現在文字的編碼 se...

linux下檢視檔案編碼及修改編碼

檢視檔案編碼 在linux中檢視檔案編碼可以通過以下幾種方式 1.在vim 中可以直接檢視檔案編碼 set fileencoding 即可顯示檔案編碼格式。如果你只是想檢視其它編碼格式的檔案或者想解決用vim檢視檔案亂碼的問題,那麼你可以在 vimrc 檔案中新增以下內容 set encoding ...

linux下檢視檔案編碼及修改編碼

1.在vim中可以直接檢視檔案編碼 set fileencoding 即可顯示檔案編碼格式。如果你只是想檢視其它編碼格式的檔案或者想解決用vim檢視檔案亂碼的問題,那麼你可以在 vimrc 檔案中新增以下內容 set encoding utf 8 fileencodings ucs bom,utf ...