Linux文字處理 awk gawk命令的使用

2021-08-27 14:59:07 字數 1122 閱讀 9959

awk 是一種文字處理和模式匹配語言,所以它通常稱為資料驅動的語言,程式語句描述需要進行匹配和處理的輸入資料,而不是程式操作步驟的序列,在許多語言中都是這樣的。awk 程式在其輸入資料中搜尋包含模式的記錄、對該記錄執行指定的操作,直到程式到達輸入的末尾。awk 程式擅長於處理資料庫和表型資料,如從多個資料集中提取一些列、建立報表或分析資料。事實上,awk 適合於編寫短小的、一次性程式,以執行一些靈活的文字處理,而使用其他的語言則可能成本較高。另外,作為一種功能強大的工具,awk 常常在命令列中使用或與管道一起使用。

gawk 的特性和優點

gawk 具有下列獨特的特性和優點:

在所有主要的 unix 平台以及其他作業系統中都可以使用它,包括 mac os x 和 microsoft® windows®。

它是可移植作業系統介面 (posix) 相容的,並且包含 1992 posix 標準中的所有特性。

它沒有預定義的記憶體限制。

可以使用一些新的內建函式和變數。

它包含一些特殊的regexp操作符。

記錄分隔符中可以包含regexp操作符。

可以使用特殊檔案支援來訪問標準的 unix 流。

可以使用 lint 檢查。

在預設情況下,它使用擴充套件的正規表示式。

它支援無限制的行長度和連續使用反斜槓字元 (/)。

它具有更好的、更具描述性的錯誤訊息。

它包含一些 tcp/ip 網路函式。

gawk 是 gnu project 的 awk 直譯器的開放源**實現。儘管早期的 gawk 發行版是舊的 awk 的替代程式,但不斷地對其進行了更新,以包含 nawk 的特性。

gawk的主要功能就是處理文字檔案的資料,自動將變數分配給每行的每個資料元素實現這一功能。

$0 表示整行

$1 表示第乙個資料字段··

$n 表示第n個資料字段

gawk 『』 data

如果正在讀取使用其他分隔符的文字,則使用選項-f

gawk -f:『』 /etc/passwd

從檔案中讀取程式:

首先將處理的命令寫入文字檔案script

然後使用命令gawk –f: –f script /etc/passwd

linux 文字處理

1.文字處理 echo echo e 033 40 35m.背景顏色範圍 40 49 40 黑 41 深紅 42 綠 43 黃色 44 藍色 45 紫色 46 深綠 47 百色 字型顏色範圍 30 39 30 黑 31 紅 32 綠 33 黃 34 藍色 35 紫色 36 深綠 37 百色 eg e...

Linux 文字處理

author janloong do o cat 連線檔案並且列印到標準輸出 sort 給文字行排序 uniq 報告或者省略重複行 cut 從每行中刪除文字區域 paste 合併檔案文字行 join 基於某個共享欄位來聯合兩個檔案的文字行 comm 逐行比較兩個有序的檔案 diff 逐行比較檔案 p...

Linux文字處理命令

4 linux文字處理命令sort命令 sort命令的功能是對檔案中的各行進行排序。sort命令有許多非常實用的選項,這些選項最初是用來對資料庫格式的檔案內容進行各種排序操作的。實際上,sort命令可以被認為是乙個非常強大的資料管理工具,用來管理內容類似資料庫記錄的檔案。sort命令將逐行對檔案中的...