dedecms採集過濾正則整理

2021-05-08 19:43:37 字數 1139 閱讀 6871

dede採集過程中最麻煩的莫過於採集的正則過濾函式的編寫。說實在的,dede在這點上和很多asp cms系統比如說動易等,採集的時候直接選擇幾個選項就可以了,簡單的完成想過濾的東西。不過他們只侷限於對文章內容的過濾不是很好。而dede卻能對所有採集的字段進行過濾,功能上彌補了易用性的缺陷,期待柏拉圖在後續版本中加上選擇性過濾功能。

下面是在綜合網際網路上各種常見正則的乙個全集:

]*)>

]*)>([^>]*)

]*)>

]*)>([^>]*)

]*)>

]*)>([^>]*)

]*)>

([^>]*)>([^>]*)

([^>]*)>

]*)>([^>]*)

]*)>

]*)>([^<]*)

]*)>

]*)>([^<]*)

]*)>

]*)>([^>]*)

]*)>

]*)>([^>]*)

]*)>

]*)>([^>]*)

]*)>([^>]*)

]*)>

]*)>

]*)>

應用示例二:**作者中連線的過濾

在採集文章的時候,有的系統裡面作者或者**處都有連線,直接採集的話將連線採集回來了,然後由於這兩個欄位有限制,通常會造成需要採集的內容沒有採集回來,所以需要在過濾處新增下面正則過濾

]*)>([^<]*)

應用示例三:文章內容中連線以及其他廣告**的過濾

這個就不用說了,當需要對所有東西過濾的時候,直接用上面所有的**過濾就可以,但是實際應用中,我們只需要對連線、動畫、呼叫等進行過濾。(這個需要按照對方內容裡面具體含有什麼**來具體操作)

一般的只有鏈結,使用二中的**進行過濾就可以了,但是實際上一般的**現在都在內容裡面加有廣告等,所以採取下面的過濾正則就可以完成過濾:

]*)>([^<]*)

]*)>([^>]*)

]*)>([^>]*)

應用示例四:過濾gg廣告**

其實這個就是在上面的內容過濾,但是很多論壇裡的網友經常問這個,所以單獨作為乙個應用列出來:

好了,上面四種應用基本上涵蓋了採集的各種應用,掌握了這個,過濾基本上就不用求人了!

織夢dedecms正規表示式採集過濾標籤列表

dede無可置疑的成為cms系統裡的強都,可是其自帶的採集系統對於乙個菜鳥站長來說卻是不容易的,如果採集的 比較簡單,那倒很容易,可是,如果要採集的 很複雜,那一般的站長就很難應付了,比如內容過濾,如果內容裡有多個ad在裡面,那就不知道怎麼過濾了.有人說用正規表示式,可惜我不會啊,我還是程式設計的工...

dedecms採集功能入門

dedecms的採集功能雖然不如一些專業軟體,但其實也還不錯的。當然也有不少新手朋友可能還摸不著頭緒,這裡,我給大家示範一下最基本的採集功能。這裡我們以採集 官方的乙個文章列表為例 首先來到後台 一,進入dedecms後台,進入 採集節點管理,新建乙個節點,模型我們就選擇 文章模型 二,填寫節點的資...

DeDeCMS織夢後台自帶採集器採集教程案例分享

前面幾篇文件,我們介紹了織夢自帶採集器使用教程,但是不是每個使用者都可以用都好,總之採集這個東西要實站積累經驗才行,因為目標站 不同,只有碰到不同的問題積累起來才能上手操作。檢視採集站點的編碼和 原始碼 選擇採集站點的編碼 我們檢視採集站點的列表頁原始碼,找到文章列表開始html和結束html標籤,...