記錄Python正規表示式學習

2021-10-25 02:16:18 字數 1699 閱讀 6793

網上找了很多方法,都仔細讀懂了,但是自己發現很多html頁面中其實可以用更巧妙的方法去提取http鏈結,用的思想是,html中url鏈結都是一組雙引號中的,我只需要針對鏈結末尾的(且出現的第乙個)雙引號即可

html頁面例

// an highlighted block

="hotnews"

>

="im**iew"id=

"im**iew"

>

""target=

"_blank"

>

"">

<

/a>

<

/div>

"hdline0"

>

""target=

"_blank"

class

="a3"

>

...的***之「喻」 <

/a>

<

/li>

="hdline1"

>

""target=

"_blank"

>

《***x》宣傳片<

/a>

"font-size: 12px"

>

<

/i>

""target=

"_blank"

>

主題歌《夢想陽光》發布<

/a>

<

/li>

="hdline2"

>

"">

""target=

"_blank"

class

="a3"

>

【央視快評】******xx道路<

/a>

<

/li>

="hdline3"

>

""target=

"_blank"

>同舟共濟<

/a>

"font-size: 12px"

>

<

/i>

""target=

"_blank"

>

《***x關鍵一招》第一集<

/a>

<

/li>

="hdline4"

>

""target=

"_blank"

class

="a3"

>

【數說xx開放40年】40年減貧7.4億人<

/a>

<

/li>

="hdline5"

>

""target=

"_blank"

>***出席的這個活動,有什麼來頭?<

/a>

<

/li>

<

/ul>

<

/div>關鍵**:

(i)結果:

學習記錄 正規表示式

學習記錄 正規表示式 註明 記錄工作和學習中常用的正規表示式以及php中常用得兩個函式preg match all preg replace 特殊字元類含義.所有字元 d所有數字 d所有非數字 w數字字母下劃線 w非數字字母下劃線 s 換行等空白區域 s非空白區域 1 匹配字元1 1 3 匹配字元1...

學習正規表示式記錄

表1.常用的元字元 說明 匹配除換行符以外的任意字元 w匹配字母或數字或下劃線或漢字 s匹配任意的空白符 d匹配數字 b匹配單詞的開始或結束 匹配字串的開始 匹配字串的結束 1.d 這個是驗證輸入5到12位的數字 2.語法說明 重複零次或更多次 重複一次或更多次 重複零次或一次 重複n次 重複n次或...

正規表示式學習記錄

表示用什麼開頭 b 表示以b開頭的字元 表示以什麼結尾 3 表示以3結尾的字元 代表任意字元 代表出現任意個數,包括0次 代表出現必須大於1次,不包括0次 代表出現2次 代表任意字元出現2次 代表出現3次和3次以上 代表出現2 5次 非貪婪匹配 從左邊開始匹配 如 匹配aaxooooooxoxxjf...