精通正規表示式 2 3

2021-08-13 08:13:49 字數 1075 閱讀 7624

perl語言是一門功能強大的指令碼語言,誕生於20世紀80年代末期,其思想主要來自其他的程式語言和工具。perl關於文字處理和正規表示式的許多概念來自兩種專業化的語言awk和sed。

使用正規表示式時,主要有3個問題值得注意:

(1)支援的元字元,以及這些元字元的意義。這通常稱為正規表示式的」流派「。

(2)正規表示式與語言或工具的」互動「方式。譬如如何進行正規表示式操作,容許進行哪些操作,以及這些操作的目標文字型別。

(3)正規表示式引擎如何將表示式應用到文字。語言或工具的設計者實現正規表示式的方法,對正規表示式能夠取得的結果有重要的影響。

正規表示式的起源

最初的想法來自20世紀40年代的兩位神經學家,warren mcculloch和walter pitts,他們研究出一種模型,認為神經系統在神經元層面上就是這樣工作的......。若干年後,數學家stephen kleene在代數學中正式描述了這種被他稱為」正則集合「的模型,正規表示式才成為現實。stephen發明了一套簡潔的表示正則集合的方法,他稱之為」正規表示式「。

關於在計算方面使用正規表示式的資料,最早發表的是2023年ken thompsom的文章regular expression search algorithm,在文中,他描述了一種正規表示式編輯器,該編輯器生成了ibm 7094的object**。由此也誕生了他的qed,這種編輯器後來成了unix中ed編輯器的基礎。

grep中的元字元

grep不支援多選結構

grep的發展歷程

egrep的發展歷程

alfred aho在at&t的貝爾實驗室寫出了egrep

其他工具的發展歷程

例如awk、lex和sed

2023年,henry spencer發布了用c語言寫的正規表示式包

perl的發展歷程

2023年12月,larry發布了perl version 1。

精通正規表示式

我只看了前面兩三章 這書的核心是4 5 6章 精通正規表示式 這本書的第四章和第六章比較值得看 1.多選結構 mm gg 表示匹配 mm 或 gg 2.忽略大小寫 s source dest i 搜尋source,將其替換為dest,此處的i只對source起作用,而不會作用於dest。3.單詞分界...

精通正規表示式 1 正規表示式入門

1 能檢查多個檔案,挑出包含重複單詞的行,高亮標記每個重複單詞 使用標準ansi的轉義字元列 同時必須顯示這行文字來自哪個檔案。2 能跨行查詢,即使兩個單詞乙個在某行末尾而另乙個在下一行的開頭,也算重複單詞。3 能進行不區分大小寫的查詢,例如 the the.重複單詞之間可以出現任意數量的空白字元 ...

《精通正規表示式》筆記

1.多選結構 mm gg 表示匹配 mm 或 gg 2.忽略大小寫 s source dest i 搜尋source,將其替換為dest,此處的i只對source起作用,而不會作用於dest。3.單詞分界符 用來匹配單詞的開始 用來匹配單詞的結束 比如 cat 匹配以 cat 結尾的單詞,如scat...