python3 匹配中文

2022-08-20 12:36:09 字數 1039 閱讀 9224

1

#!/usr/bin/env python2#

-*- coding: utf-8 -*-

3__author__ = '

leo'

4__date__ = '

2017/9/27'5

6'''

78'''910

import

re11

1213

defget_chinese_color(color_name):

14 color_str = "

[\u4e00-\u9fff]+

"15 res =re.findall(color_str, color_name)

16return res[0]

下面是google出現的幾種主要非英文字符集的編碼範圍

主要非英文語系字元範圍

範圍

編碼

說明

2e80~33ffh

中日韓符號區

收容康熙字典部首、中日韓輔助部首、注音符號、日本假名、韓文音符,中日韓的符號、標點、帶圈或帶括符文數字、月份,以及日本的假名組合、單位、年號、月份、日期、時間等。

3400~4dffh

中日韓認同文字擴充a區

中日韓認同表意文字擴充a區,總計收容6,582個中日韓漢字。

4e00~9fffh

中日韓認同表意文字區

中日韓認同表意文字區,總計收容20,902個中日韓漢字。

a000~a4ffh

彝族文字區

收容中國南方彝族文字和字根

ac00~d7ffh

韓文拼音組合字區

收容以韓文音符拼成的文字

f900~faffh

中日韓相容表意文字區

總計收容302個中日韓漢字

fb00~fffdh

文字表現形式區

收容組合拉丁文本、希伯來文、阿拉伯文、中日韓直式標點、小符號、半形符號、全形符號等。

23 匹配空格

說明 到目前為止的挑戰,涵蓋了匹配字母表的字母和數字。你也可以匹配字母之間的空白或空格。你可以使用 s搜尋空格,這是乙個小寫的s。此模式不僅匹配空格,還包括回車 製表符 換頁和新行字元。你可以將其看作與字元類 r t f n v 類似。var whitespace whitespace.whites...

8 匹配問題

匹配是基於無向圖的演算法,且這個無向圖是乙個二分圖。二分圖 二分圖 對於圖中的頂點可以分成倆部分,圖的每條邊都是橫跨倆部分的。匹配問題的應用 匹配問題,主要考察 匹配問題的問題核心,在於最大匹配,是否是完全匹配只需要檢測所有頂點是否匹配到即可。匈牙利演算法 bool hungary adjmatri...

oneOf 唯一匹配

多個 loader,但是每個檔案只能匹配乙個 loader,被乙個 loader 處理,因此可以使用 oneof 唯一匹配,不需要每個檔案把所有的 loader 都詢問一遍,可以提高 loader 的執行效率 const require path const minics tractplugin r...