awk使用第7部分 awk對多行資料的處理例項

awk 每次從資料檔案中只讀取一行資料進行處理，這是因為awk中有乙個內建變數rs(record separator) ，rs將檔案中的資料分隔成以行為單位的記錄record。rs預設值以」/n」(跳行符號)分隔資料檔案中的資訊，所以預設情況下awk 中一行資料就是一行record。但有些檔案中一行record涵蓋了多行資料，這種情況下不能再以」/n」來分隔records。最常使用的方法是相鄰的records之間改用乙個空白行來分隔。在awk程式中，令rs= 「」(空字串)後，awk把會空白行當成來檔案中record的分隔符。顯然awk對rs=」"另有深意，簡單來說是這樣的，當rs=」" 時：多個相鄰的空白行，awk僅作為乙個record saparator(awk不會在多個相鄰的空白行之中選取一行做為空的record) ；awk會略過(skip)檔案頭和檔案尾的空白行，所以不會因為有這樣的空白行，造成awk多讀了二行空的資料。下面舉個例子看一下，首先建立乙個資料檔案myfreelinux.dat，內容如下:

[root@myfreelinux pub]# cat myfreelinux.dat

wanger

linux_basic

lisan

linux_server

windows_server

zhaosi

awk_tools

grub

regular_expression

該檔案的開頭有3行空白行，各行record之間分別用2個和1個空白行隔開。那麼下面，通過幾個例子來看一下。首先編輯乙個awk程式指令碼report1.awk，內容如下：[root@myfreelinux pub]# cat report1.awk

#!/bin/sh

awk 『begin

』 $*

執行該程式指令碼和產生的結果如下：

[root@myfreelinux pub]# bash report1.awk myfreelinux.dat

one: reporter is : wanger

1 linux_basic

two: reporter is : lisan

1 linux_server

2 windows_server

three: reporter is : zhaosi

1 awk_tools

2 grub

3 regular_expression

解釋說明：上面這個程式的字段分隔字元是( fs= 「/n」 )，這樣的話一行資料就是乙個field，而且rs=「」，所以這三個使用者的記錄是通過空行來分隔的。那麼awk讀入的第一行record 為

wanger

linux_basic

其中$1的值是」wanger」，$2的值是：「 linux_basic」，程式中的number[ ]是乙個陣列(array)，用來記錄英文數字，比如number[1]=one:，number[2]=two:等等，這個是使用awk的字串函數split()來把英文數字放進陣列number[ ]中的。

函式split( )用法如下：

split( 原字串，陣列名，分隔字元(field separator) )

awk將根據指定的分隔字元(field separator)分隔原字串成乙個個的字段(field)，並將各欄位記錄到陣列中。

awk使用第7部分 awk對多行資料的處理例項

awk的使用第4部分在awk中使用陣列

awk的使用第二部分 awk的執行方式

20151205正則第七部分（awk複習）

awk使用 第7部分 awk對多行資料的處理例項

awk的使用 第4部分 在awk中使用陣列

awk的使用 第二部分 awk的執行方式

20151205正則第七部分（awk複習）

相關推薦

awk使用第7部分 awk對多行資料的處理例項

awk的使用第4部分在awk中使用陣列

awk的使用第二部分 awk的執行方式