用正規表示式寫的HTML分離函式

2021-03-31 08:56:31 字數 966 閱讀 4281

存成.asp檔案,執行,你用asphttp抓內容的時候用這個很爽,當然自己要改進一下了

<%

option explicit

function striphtml(strhtml)

'strips the html tags from strhtml

dim objregexp, stroutput

set objregexp = new regexp

objregexp.ignorecase = true

objregexp.global = true

objregexp.pattern = "<.+?>"

'replace all html tag matches with the empty string

stroutput = objregexp.replace(strhtml, "")

'replace all < and > with < and >

stroutput = replace(stroutput, "<", "<")

stroutput = replace(stroutput, ">", ">")

striphtml = stroutput 'return the value of stroutput

set objregexp = nothing

end function

%>

<% if len(request("txthtml")) > 0 then %>

view of string with no html stripping:

<%=request("txthtml")%>

view of string with html stripping:

<%=striphtml(request("txthtml"))%>

<% end if %>

用正規表示式寫的HTML分離函式

存成.asp檔案,執行,你用asphttp抓內容的時候用這個很爽,當然自己要改進一下了 option explicit function striphtml strhtml strips the html tags from strhtml dim objregexp,stroutput set o...

asp 經常用的過濾html正規表示式 及函式

dim clstemplosestr,regexclstemplosestr cstr contentstr set regex new regexp regex.pattern regex.ignorecase true regex.global true clstemplosestr regex...

正規表示式 HTML中的匹配

從html中文字中提取email地址和http url,是在做爬蟲時候的經常用到的技術,雖然變成語言本身可以幫助我們找到他們,但是用正規表示式來匹配也是很有用和具有實際意義的方法。html不是有特別嚴格程式設計要求的,因此在匹配時會遇到很多特殊情況需要特殊處理,這裡僅僅給出一般化的解決方法 文字 d...

正規表示式刪除指定的HTML 標籤

1.抓取某網頁的資料後 比如描述 如果照原樣顯示的話,可能會因為它裡面包含沒有閉合的html標籤而打亂了格式,也可能它裡面用了比較讓人 費解 的html標籤,把預訂的格式攪亂.如果全盤刪除裡面的 html 標籤,可能會造成閱讀上的困難 比如 a,img 這些標籤 最好是刪除一部分,保留一部分.下面是...

收藏 幾個常用的用正規表示式驗證字串的函式

應用也很簡單,以上函式均是應用在伺服器端,若用在客戶端需要把runat server去掉。我舉兩個例子 if isipaddress.test str false then response.write ip 地址錯誤,請重新輸入。response.end end if if testpwd str...