python 正規表示式匹配中文

2021-08-15 12:33:56 字數 960 閱讀 9828

python 正規表示式匹配中文

檔案編碼為 utf-8

設定預設編碼為 utf-8

中文需要轉換為 \u 形式的編碼,也就是  編碼,

輪換方法,cmd 下執行 python 進入 python 命令提示符模式

執行:>>> u'中文'.encode('unicode_escape')

輸出為:

'\\u4e2d\\u6587'

使用示例:

import sys

defaultencoding = 'utf-8'

if sys.getdefaultencoding() != defaultencoding:

reload(sys)

sys.setdefaultencoding(defaultencoding)

import itchat,time,re

from itchat.content import *

@itchat.msg_register([text])

def text_reply(msg):

print(msg['text'])

match = re.search(u'[\u5e74]',msg['text'])

print(match)

if match:

itchat.send(('那我就祝您狗年大吉大利'), msg['fromusername'])

@itchat.msg_register([picture, recording, video, sharing])

def other_reply(msg):

itchat.send(('那我就祝您狗年大吉大利'), msg['fromusername'])

itchat.auto_login(enablecmdqr=true,hotreload=true)

itchat.run()

中文正規表示式匹配 正則中文匹配

這篇文章主要講如何使用正則 匹配中文字元,中文正規表示式的匹配規則不像其他正則規則一樣容易記住,下面一起看看這個中文正規表示式是怎麼樣的。w匹配的僅僅是中文,數字,字母,對於國人來講,僅匹配中文時常會用到,見下 匹配中文字元的正規表示式 u4e00 u9fa5 或許你也需要匹配雙位元組字元,中文也是...

中文正規表示式匹配 正則中文匹配

這篇文章主要講如何使用正則匹配中文字元,中文正規表示式的匹配規則不像其他正則規則一樣容易記住,下面一起看看這個中文正規表示式是怎麼樣的。w匹配的僅僅是中文,數字,字母,對於國人來講,僅匹配中文時常會用到,見下 匹配中文字元的正規表示式 u4e00 u9fa5 或許你也需要匹配雙位元組字元,中文也是雙...

js 正規表示式匹配中文

簡單匹配中文方法 u0000 u00ff 匹配非單位元組字元 另錯誤方法 u00 uff 匹配 非單位元組字元 還包括一些全半形符號如,等 還有vwxyz字元 說明 u0000 u00ff.包含unicode單位元組編碼 0 255編碼 包含基本控制字元和拉丁文本母。採用該否定表示式,粗略判斷是否含...