Python 正則匹配文字中的時間串

2021-10-04 00:11:30 字數 726 閱讀 3061

text=

'現在是北京時間2020-3-16 2023年3月16日 2020.3.16 13:00'

re.findall(

'\d年\d月\d日'

,text)

[『2023年3月16日』]
re.findall(

'\d\-\d\-\d'

,text)

[『2020-3-16』]
re.findall(

'\d[\.\-/年]\d[\.\-/月]\d[\.\-/日]'

,text)

[『2020-3-16』, 『2023年3月16』, 『2020.3.16』]
正規表示式的() {} 有著不同的意思。

() 是為了提取匹配字串的,表示式中有幾個()就有幾個相應的匹配字串

(\s*)表示連續空格的字串

是定義匹配的字元範圍。比如[a-za-z0-9]表示相應位置的字元要匹配英文本元和數字。[\s表示空格或者號]

{}一般是用來匹配的長度。比如\s表示匹配三個空格,\s[1,3]表示匹配1到3個空格

(0-9)匹配』0-9』本身。[0-9]匹配數字(注意後面有,可以為空)[0-9]+匹配數字(注意後面有+,不可以為空)

寫法是錯誤的

[0-9]表示長度為0到9的數字字串。

正則匹配文字中的鏈結

最近做的乙個專案中遇到使用正則匹配一段文字中的 url 並將其顯示為短連線的需求。顯示的文字包括為防止 xss 而用 js 處理過的帶有特殊符號的文字以及 php 直接渲染後的文字,所以需要兩個正規表示式。匹配不帶特殊符號的文字的正則 匹配帶有特殊符號的文字的正則 type 為 0 表示文字中不帶有...

Python使用正則匹配處理文字

文字內容處理 import re pattern re.compile xmin n.xmax n.text pattern1 re.compile xmax pattern2 re.compile xmin with open 041.textgrid as lines 一次性讀入txt檔案,並把...

Python 正則匹配標籤中的 中文

有如下內容 text 測試學習正則 使用正則 匹配出所有的中文。p re.compile r x00 xff div for m in p.finditer text print m.group 1 列印結果 測試學習正則這樣就是比較的簡單,直接是 匹配ascii碼大於255的那些字元 包括中文符號...