Linux Linux 檔案中 M字元處理

2021-09-20 13:47:09 字數 2342 閱讀 4492

當我們把檔案從windows傳到linux環境時候,常常在每一行的末尾,會出現一些 ^m的字元.而這些字元會影響檔案的正常讀寫和執行;

要去掉這些'^m'字元,有很多種辦法,比如直接dox2unix,也可以使用一些命令去處理.比如:

刪除windows檔案「造成」的'^m'字元:

# cat file | tr -d "\r" > new_file

或者# cat file | tr -s "\r" "\n" > new_file

通過使用 tr,可以非常容易地實現 sed 的許多最基本功能。您可以將 tr 看作為 sed 的(極其)簡化的變體:它可以用乙個字元來替換另乙個字元,或者可以完全除去一些字元。您也可以用它來除去重複字元。這就是所有 tr 所能夠做的。 

tr用來從標準輸入中通過替換或刪除操作進行字元轉換。tr主要用於刪除檔案中控制字元或進行字元轉換。使用tr時要轉換兩個字串:字串1用於查詢,字串2用於處理各種轉換。tr剛執行時,字串1中的字元被對映到字串2中的字元,然後轉換操作開始。

帶有最常用選項的tr命令格式為:

tr -c -d -s ["string1_to_translate_from"] ["string2_to_translate_to"] < input-file

這裡:-c 用字串1中字符集的補集替換此字符集,要求字符集為ascii。

-d 刪除字串1中所有輸入字元。

-s 刪除所有重複出現字串行,只保留第乙個;即將重複出現字串壓縮為乙個字串。

input-file是轉換檔名。雖然可以使用其他格式輸入,但這種格式最常用。

2、字元範圍

指定字串1或字串2的內容時,只能使用單字元或字串範圍或列表。

[a-z] a-z內的字元組成的字串。

[a-z] a-z內的字元組成的字串。

[0-9] 數字串。

\octal 乙個三位的八進位制數,對應有效的ascii字元。

[o*n] 表示字元o重複出現指定次數n。因此[o*2]匹配oo的字串。

tr中特定控制字元的不同表達方式

速記符含義八進位制方式

\a ctrl-g  鈴聲\007

\b ctrl-h  退格符\010

\f ctrl-l  走行換頁\014

\n ctrl-j  新行\012

\r ctrl-m  回車\015

\t ctrl-i  tab鍵\011

\v ctrl-x  \030

例項:、將檔案file**現的"abc"替換為"xyz"

# cat file | tr "abc" "xyz" > new_file

【注意】這裡,凡是在file**現的"a"字母,都替換成"x"字母,"b"字母替換為"y"字母,"c"字母替換為"z"字母。而不是將字串"abc"替換為字串"xyz"。

2、使用tr命令「統一」字母大小寫

(小寫 --> 大寫)

# cat file | tr [a-z] [a-z] > new_file

(大寫 --> 小寫)

# cat file | tr [a-z] [a-z] > new_file

3、把檔案中的數字0-9替換為a-j

# cat file | tr [0-9] [a-j] > new_file

4、刪除檔案file**現的"snail"字元

# cat file | tr -d "snail" > new_file

【注意】這裡,凡是在file檔案**現的's','n','a','i','l'字元都會被刪除!而不是緊緊刪除出現的"snail」字串。

5、刪除檔案file**現的換行'\n'、製表'\t'字元

# cat file | tr -d "\n\t" > new_file

不可見字元都得用轉義字元來表示的,這個都是統一的。

6、刪除「連續著的」重複字母,只保留第乙個

# cat file | tr -s [a-za-z] > new_file

7、刪除空行

# cat file | tr -s "\n" > new_file

8、刪除windows檔案「造成」的'^m'字元

# cat file | tr -d "\r" > new_file

或者# cat file | tr -s "\r" "\n" > new_file

【注意】這裡-s後面是兩個引數"\r"和"\n",用後者替換前者

9、用空格符\040替換製表符\011

# cat file | tr -s "\011" "\040" > new_file

10、把路徑變數中的冒號

":",替換成換行符"\n"

# echo $path | tr -s ":" "\n"

linux Linux學習總結 套接字

bsd套接字介面 l i n u x支援多種套接字型別。套接字型別,是指建立套接字的應用程式所希望的通訊服務 型別。同一協議族可能提供多種服務型別,比如t c p i p協議族提供的虛電路與資料報就是兩 種不同的通訊服務型別,linux bsd支援如下幾種套接字型別 stream 提供可靠的面向連線...

Linux Linux 檔案基本操作

複製檔案 目錄 cp 原始檔 目標檔案 常用引數 r 遞迴複製整個目錄樹 v 顯示詳細資訊 移動 重新命名檔案或目錄 mv 檔案 目標目錄 若只指定了目標資料夾,沒有指定目標檔名,則會直接移動,保留原來的檔名 若指定了目標檔名,則會移動並重命名 重新命名 mv 原來的名字 新名字 建立 刪除檔案 建...

Linux Linux系統(檔案操作)

linux有三種檔案型別,普通檔案,目錄,裝置檔案 檢視檔案 使用命令ls獲取ll,檢視檔案列表,引數 l 列表形式 a 展示隱藏檔案 使用元字元 檢視匹配的檔案列表,例如 ll a 展示以a開頭的檔案 使用cat命令,檢視檔案內容,引數 b顯示行號,檔名 使用wc命令,統計當前檔案的行數 單詞數 ...