Python 3 正規表示式對中文的匹配

2021-07-11 20:48:21 字數 475 閱讀 4566

import re

s='中文匹配7.14 3000 '.encode('utf-8')

s=s.decode('utf8')

m =re.findall(u"[\u4e00-\u9fa5]+",s)

print(m)

搜了半天網上的都是python2的**,根本不能執行,浪費半天時間,

[\u4e00-\u9fa5]+
中文正規表示式

看了出錯cannot use a string pattern on a bytes-like object

原來型別str和byte不是同一型別無法匹配

稍微改了一下2次編碼整成同一型別,成功匹配。

轉碼帶u的字元

s.decode('unicode_escape')

python3正規表示式

正規表示式,又稱規則表示式。英語 regular expression,在 中常簡寫為regex regexp或re 電腦科學的乙個概念。正規表示式通常被用來檢索 替換那些符合某個模式 規則 的文字。正規表示式是對字串操作的一種邏輯公式,就是用事先定義好的一些特定字元 及這些特定字元的組合,組成乙個...

Python3 正規表示式

常用的匹配模式 正規表示式是乙個特殊的字串行,它能幫助你方便的檢查乙個字串是否與某種模式匹配。re 模組使 python 語言擁有全部的正規表示式功能。re.match函式 re.match 嘗試從字串的起始位置匹配乙個模式,如果不是起始位置匹配成功的話,match 就返回none。re.match...

Python3 正規表示式

正規表示式是乙個特殊的字串行,它能幫助你方便的檢查乙個字串是否與某種模式匹配。python 自1.5版本起增加了re 模組,它提供 perl 風格的正規表示式模式。re 模組使 python 語言擁有全部的正規表示式功能。compile 函式根據乙個模式字串和可選的標誌引數生成乙個正規表示式物件。該...