實體識別 正規表示式 提取身份證號

2021-10-01 13:53:42 字數 821 閱讀 8625

提取身份證號:

import re

text = "418193200001016666"

idcards_pattern = r'^([1-9]\d[12]\d(0[1-9]|1[012])(0[1-9]|[12][0-9]|3[01])\d[0-9xx])$'

ids = re.findall(idcards_pattern, text, flags=0)

print(ids)

列印結果:

[('140581199509030032', '09', '03')]

附:

正規表示式的書寫語法

1、^  表示匹配字串的開始位置  (例外  用在中括號中[ ] 時,可以理解為取反,表示不匹配括號中字串)

2、$  表示匹配字串的結束位置

3、*  表示匹配 零次到多次

4、+  表示匹配 一次到多次 (至少有一次)

5、?  表示匹配零次或一次

6、.  表示匹配單個字元 

7、|  表示為或者,兩項中取一項

8、(  ) 小括號表示匹配括號中全部字元

9、[  ] 中括號表示匹配括號中乙個字元 範圍描述 如[0-9 a-z a-z]

10、 大括號用於限定匹配次數  如 表示匹配n個字元  表示至少匹配n個字元  表示至少n,最多m

11、\  轉義字元 如上基本符號匹配都需要轉義字元   如 \*  表示匹配*號

12、\w 表示英文本母和數字  \w  非字母和數字

13、\d  表示數字   \d  非數字

正規表示式 判斷身份證號

判斷身份證是否正確 param value 身份證號 return yes or no bool judgeidcardlegal nsstring value bool judgeidcardlegal nsstring value else 省份 nsarray areasarray 11 12...

正規表示式之身份證號驗證

分析 身份證的號碼結構為 身份證前六位 表示編碼物件常住戶口所在縣 市 旗 區 的行政區劃 身份證第七位到第十四位 表示編碼物件出生的年 月 日,其中年份用四位數字表示,年 月 日之間不用分隔符。例如 1981年05月11日就用19810511表示。身份證第十五位到十七位 為同一位址碼所標識的區域範...

用正規表示式驗證身份證號

用正規表示式驗證身份證號 開發工具與關鍵技術 vs mvc在現在的資訊時代,個人的資訊真假難辨,但身份證號就是唯一的,也正因如此我們的資訊錄入都離不開身份證的使用。有了身份證的廣泛使用,同時驗證身份證號碼的知識也被廣泛應用,而我現在要說的就是用正規表示式驗證身份證號碼。在這裡我會以乙個包含新增身份證...