Python正規表示式初識(九)

2022-02-08 09:55:53 字數 1509 閱讀 3065

該特殊字元是固定的寫法,其代表的意思是漢字。換句話說,只要字元中是漢字,就可以通過該字元進行匹配,該特殊字元也是用中括號括起來的。具體的**演示如下。

1、原始字串是「加油」,兩個漢字,然後將匹配模式直接為[\u4e00-\u9fa5],如下圖所

可以看到此時的輸出結果僅僅出現了乙個「加」字,因為該匹配模式預設是匹配乙個字元。

2、如何想匹配多個字元,只需要在匹配模式後面加乙個「+」號即可,表示匹配連續出現的漢字,如下圖所示。

此時可以看到「加油」全都匹配出來了。

3、為了進一步加強對該特殊字元的理解,現在將「加油」兩字中嵌入非漢字,如下圖所示。

可以看到只匹配到了「加」,但是非漢字字元「a」及其以後的字元全部都匹配不到了,因為原始字串並不是連續出現的漢字。

4、將非漢字字元放到字串最後邊,如下圖所示。

此時可以看到「加油」這兩個連續的漢字可以成功匹配,但是非漢字字元匹配不到。

5、如果將「加油」中間加個空格,改為「加 油」,其他的保持不變,如下圖所示。

此時可以看到輸出的結果僅僅是個「加」字,空格及其之後的字元都匹配不到,因為原始字串並不是連續出現的漢字。

6、舉個栗子,在實際應用中,往往會需要用到連續匹配漢字的地方。如現在有個需求,需要匹配字串中的「xx」大學,如「清華大學」、「北京大學」、「中山大學」等,我們只知道字元「xx」是連續的中文,此時就可以用到本文介紹的漢字字元,如下圖所示。

此時可以看到「清華大學」匹配成功。需要注意的是特殊字元「?」記得加上,代表非貪婪模式,如果不加這個字元的話,則匹配模式從字元的後面往前取,得到的結果僅僅為「華大學」,如下圖所示。

7、同樣的,如果要匹配「上海交通大學」,也是如此,如下圖所示。

小夥伴們,關於漢字匹配字元,你們get到了麼?

正規表示式 1 初識正規表示式

簡單地說,正規表示式就是一套處理字串的規則和方法,以行為單位對字串進行處理,通過特殊的符號的輔助,我們可以快速的過濾,替換某些特定的字串。運維工作中,會有大量訪問日誌,錯誤日誌,大資料。如何能夠快速的過濾出我們需要的內容,這就需要正規表示式。awk,sed,grep egrep 三劍客要想能工作的更...

正規表示式初識

用來指定乙個字元集合 字元直接是 或 的關係,不是乙個特定的字串,跟 abc 不同 abc a z 在字符集中,元字元 不起作用 abc abc 元字元 在字串尾不起作用 abc 就是普通字元。元字元在字符集首表示匹配補集,abc 就是匹配除了a,b,c以外的字元。匹配行首,位於字串首。制定規則re...

正規表示式初識

正規表示式 為轉義如 表示.郵箱匹配 grep e 0 9a za z 0 9a za z a za z a.txt 查詢郵箱 a z 所有小寫字母 a z 所有大寫字母 0 9 所有數字 0 9 所有非數字 表達取反 0 9 a z 0個或多個小寫字母 a z 至少出現一次小寫字母 a z 出現0...