記乙個正規表示式匹配的錯誤

2022-07-29 06:51:08 字數 655 閱讀 9780

**是這樣

1 htmlsource='charset

="gbk

" />

'2 charset = re.findall('

',htmlsource)

開始想把'gbk'匹配出來,由於html檔案的meta標籤各個**的不一樣,於是只能按照上面的寫法,先匹配出『「gbk』

,再把"去掉,可是這麼天真的正規表示式卻匹配錯誤了,因為從地乙個"開始就已經把結果匹配出來了,所以結果只能是匹配錯了

然後改為

htmlsource='

'charset = re.findall('

',htmlsource)

這樣就可以了

後來測試了一下,如果字串為

htmlsource="

"gbk"

/>

"

或為

htmlsource='

'gbk"

'/>'

結果都會出錯,因為外層引號會內層引號不能相同,否則就會報錯,所以一定要保持外層引號與內層引號不相同,不能全是單引號也不能全是雙引號,如果是那樣的話,字串本身就是錯誤的,,,,,,,(有點迷糊)

待續,,,,

正規表示式 匹配

字串 void abtr quint32 ab 表示乙個正規表示式 template class bidirectionaliterator class allocator std allocator sub match bidirectionaliterator class match resul...

正規表示式匹配

請實現乙個函式用來匹配包括 和 的正規表示式。模式中的字元 表示任意乙個字元,而 表示它前面的字元可以出現任意次 包含0次 在本題中,匹配是指字串的所有字元匹配整個模式。例如,字串 aaa 與模式 a.a 和 ab ac a 匹配,但是與 aa.a 和 ab a 均不匹配 解法 首先要想到用遞迴處理...

正規表示式匹配

請實現乙個函式用來匹配包括 和 的正規表示式。模式中的字元 表示任意乙個字元,而 表示它前面的字元可以出現任意次 包含0次 在本題中,匹配是指字串的所有字元匹配整個模式。例如,字串 aaa 與模式 a.a 和 ab ac a 匹配,但是與 aa.a 和 ab a 均不匹配 class solutio...