awk陣列操作

2021-09-01 18:14:20 字數 2445 閱讀 8833

用awk進行文字處理,少不了就是它的陣列處理。那麼awk陣列有那些特點,一般常見運算又會怎麼樣呢。我們先看下下面的一些介紹,結合例子我們會講解下它的不同之處。在 awk 中陣列叫做關聯陣列(associative arrays),因為下標記可以是數也可以是串。awk 中的陣列不必提前宣告,也不必宣告大小。陣列元素用 0 或空串來初始化,這根據上下文而定。例如:

一、定義方法

1:可以用數值作陣列索引(下標)

tarray[1]=「cheng mo」

tarray[2]=「800927」

2:可以用字串作陣列索引(下標)

tarray[「first」]=「cheng 」

tarray[「last」]=」mo」

tarray[「birth」]=」800927」

使用中 print tarray[1] 將得到」cheng mo」 而 print tarray[2] 和 print[「birth」] 都將得到 」800927」 。

二、陣列相關函式

[chengmo@localhost ~]$ awk --version

gnu awk 3.1.5

使用版本是:3.1以上,不同版本下面函式不一定相同

[chengmo@localhost ~]$ awk 'begin'

4 4length返回字串以及陣列長度,split進行分割字串為陣列,也會返回分割得到陣列長度。

(asort使用):

[chengmo@localhost ~]$ awk 'begin'

4asort對陣列進行排序,返回陣列長度。

[chengmo@localhost ~]$ awk 'begin}'

4 test

1 it

2 is

3 afor…in 輸出,因為陣列是關聯陣列,預設是無序的。所以通過for…in 得到是無序的陣列。如果需要得到有序陣列,需要通過下標獲得。

[chengmo@localhost ~]$ awk 'begin}'

1 it

2 is

3 a4 test

注意:陣列下標是從1開始,與c陣列不一樣。

乙個錯誤的判斷方法

[chengmo@localhost ~]$ awk 'begin;for(k in tb)}'

no found

a a1

b b1

c以上出現奇怪問題,tb[「c」]沒有定義,但是迴圈時候,發現已經存在該鍵值,它的值為空,這裡需要注意,awk陣列是關聯陣列,只要通過陣列引用它的key,就會自動建立改序列.

正確判斷方法:

[chengmo@localhost ~]$ awk 'begin;for(k in tb)}'

a a1

b b1

if(key in array) 通過這種方法判斷陣列中是否包含」key」鍵值。

刪除鍵值:

[chengmo@localhost ~]$ awk 'begin}'

b b1

delete array[key]可以刪除,對應陣列key的,序列值。

三、二維陣列使用(多維陣列使用)

awk的多維陣列在本質上是一維陣列,更確切一點,awk在儲存上並不支援多維陣列。awk提供了邏輯上模擬二維陣列的訪問方式。例 如,array[2,4] = 1這樣的訪問是允許的。awk使用乙個特殊的字串subsep (\034)作為分割字段,在上面的例子中,關聯陣列array儲存的鍵值實際上是2\0344。

類似一維陣列的成員測試,多維陣列可以使用 if ( (i,j) in array)這樣的語法,但是下標必須放置在圓括號中。

類似一維陣列的迴圈訪問,多維陣列使用 for ( item in array )這樣的語法遍歷陣列。與一維陣列不同的是,多維陣列必須使用split()函式來訪問單獨的下標分量。split ( item, subscr, subsep)

[chengmo@localhost ~]$ awk 'begin}}'

1 * 1 = 1

1 * 2 = 2

1 * 3 = 3

1 * 4 = 4

1 * 5 = 5

1 * 6 = 6

……可以通過array[k,k2]引用獲得陣列內容.

方法二:

[chengmo@localhost ~]$ awk 'begin

}for(m in tarr)

}'

awk 陣列例項

awk 陣列例項 awk的陣列,一種關聯陣列 associative arrays 下標可以是數字和字串。因無需對陣列名和元素提前宣告,也無需指定元素個數 所以 awk的陣列使用非常靈活。首先介紹下幾個awk 1 建立陣列 array index value 陣列名 array 下標index 以及...

awk陣列簡介

一 定義 在 awk 中,陣列是關聯陣列,它的特點是 1 陣列的下標可以是整數,也可以是負數甚至是字串 2 陣列的下標可以不連續。awk 的變數 ignorecase 的值不影響陣列下標。當 awk 建立乙個陣列的時候,如果沒有指定下標,預設已連續整數作為下標,起始值是 1.awk 的陣列是什麼高效...

awk陣列簡介

一 定義 在 awk 中,陣列是關聯陣列,它的特點是 1 陣列的下標可以是整數,也可以是負數甚至是字串 2 陣列的下標可以不連續。awk 的變數 ignorecase 的值不影響陣列下標。當 awk 建立乙個陣列的時候,如果沒有指定下標,預設已連續整數作為下標,起始值是 1.awk 的陣列是什麼高效...