如何使用 awk 按模式篩選文字或字串

2021-09-22 06:40:49 字數 1571 閱讀 9296

讓我們看一看下面這個例子,比方說你有乙個寫有你想要購買的食物的購物清單,其名稱為 food_prices.list,它所含有的食物名稱及相應的**如下所示:

$ cat food_prices.list 

no item_name quantity price

1 mangoes 10 $2.45

3 bananas 5 $0.90

5 oranges 10 $0.78

6 tomatoes 5 $0.55

7 onions 5 $0.45

然後,你想使用乙個 (*) 符號去標記那些單價大於 $2 的食物,那麼你可以通過執行下面的命令來達到此目的:

$ awk '/ */$[2-9]/.[0-9][0-9] */  / */$[0-1]/.[0-9][0-9] */ ' food_prices.list
列印出單價大於 $2 的專案

從上面的輸出你可以看到在含有芒果和菠蘿的那行末尾都已經有了乙個 (*) 標記。假如你檢查它們的單價,你可以看到它們的單價的確超過了 $2 。

在這個例子中,我們已經使用了兩個模式:

第乙個模式: / */$[2-9]/.[0-9][0-9] */ 將會得到那些含有食物單價大於 $2 的行。

第二個模式: /*/$[0-1]/.[0-9][0-9] */ 將查詢那些食物單價小於 $2 的那些行。

上面的命令具體做了什麼呢?這個檔案有四個字段,當模式一匹配到含有食物單價大於 $2 的行時,它便會輸出所有的四個欄位並在該行末尾加上乙個 (*) 符號來作為標記。

第二個模式只是簡單地輸出其他含有食物單價小於 $2 的行,按照它們出現在輸入檔案 food_prices.list 中的樣子。

這樣你就可以使用模式來篩選出那些**超過 $2 的食物專案,儘管上面的輸出還有些問題,帶有 (*) 符號的那些行並沒有像其他行那樣被格式化輸出,這使得輸出顯得不夠清晰。

我們在 awk 系列的第二部分中也看到了同樣的問題,但我們可以使用下面的兩種方式來解決:

1、可以像下面這樣使用 printf 命令,但這樣使用又長又無聊:

$ awk '/ */$[2-9]/.[0-9][0-9] */  / */$[0-1]/.[0-9][0-9] */ ' food_prices.list

使用 awk 和 printf 來篩選和輸出專案

2、 使用 $0 字段。awk 使用變數0來儲存整個輸入行。對於上面的問題,這種方式非常方便,並且它還簡單、快速:

$ awk '/ */$[2-9]/.[0-9][0-9] */  / */$[0-1]/.[0-9][0-9] */ ' food_prices.list

使用 awk 和變數來篩選和輸出專案

結論

這就是全部內容了,使用 awk 命令你便可以通過幾種簡單的方法去利用模式匹配來篩選文字,幫助你在乙個檔案中對文字或字串的某些行做標記。

Linux 篩選文字內容 awk 與 grep

當你想爭對乙個文字檔案的特定內容進行篩選的時候,第一想到的是用awk還是grep?眾所周知 大家都知道 的是grep則以查詢著稱,而awk是linux上非常強大的文字處理工具,它基本上可以滿足大部分日常需求,這篇隨筆主要想展示一下分別用這兩個工具處理以下兩個實際問題。將gff檔案中注釋型別為gene...

awk 系列 如何使用 awk 內建變數

我們將逐漸揭開 awk 功能的神秘面紗,在本節中,我們將介紹 awk 內建built in變數的概念。你可以在 awk 中使用兩種型別的變數,它們是 使用者自定義user defined變數 我們在第八節中已經介紹了 和內建變數。awk 內建變數示例 awk 內建變數已經有預先定義的值了,但我們也可...

awk系列 如何使用awk語言編寫指令碼

從 awk 系列開始直到第 12 部分,我們都是在命令列或者指令碼檔案裡寫一些簡短的 awk 命令和程式。然而 awk 和 shell 一樣也是乙個解釋型語言。通過從開始到現在的一系列的學習,你現在能寫可以執行的 awk 指令碼了。和寫 shell 指令碼差不多,awk 指令碼以下面這一行開頭 pa...