如何使用火車頭採集器

2021-09-01 21:55:12 字數 1321 閱讀 8213

而dz論壇使用的是uub格式,如:[p]正文[/p],所以在發布時要做乙個自動轉換。下面就是設定這個自動轉換功能。 

如果你的文章發布的dz門戶,就不需要轉換為ubb.  

1、 開啟發布模組配置:

2、 以軟體裡自帶的discuz!x 2.0論壇 為模板進行修改。我試過了可以正常住discuz!x 2.5發布文章。

3、 設定為:對 [標籤: 內容]做 ubb轉換,如下圖中的樣子: 最後,另存為乙個新的「發布模組」,起乙個新名字,後面要使用。

4、在「內容發布引數」選項卡中修改: [標籤: 內容] 的值可以用使用 來替代。如上圖

黃色框內的[標籤: 內容]替換成  ,

第一部分工作就完成了。 

最後儲存時要起個新名字。

三、準備採集 

設定如下圖:

還有下圖

7 對於採集工作,還有一些重要的設定,很重要。 

如果你不是使用火車頭自帶的演示任務,而是自己新建採集任務,下面的內容就很重要。  

下面的設定,是對採集的文章正文進行的設定。 

採集時,可選擇性的過濾掉一些html標籤,如, 如果你不知道要去掉哪些,就什麼也不用改,使用預設值吧。

火車頭軟體安裝目錄\data\locoyspider\80\  資料夾中。 

客戶通過瀏覽器訪問我論壇的文章裡的時,統一訪問伺服器上dz程式的根目錄下的./pic/目錄,使用相對路徑,pic目錄下面我們再新建乙個80目錄,  所以,把火車頭安裝目錄下的\data\locoyspider\中的 80 資料夾,copy到伺服器dz程式的根目錄下的pic目錄中,  這樣,就儲存在了:伺服器dz程式的根目錄\pic\80\  目錄 

MIPCMS如何用火車頭採集自定義字段?

文章目錄 隱藏 addons collecthuochetou controller apiusercollecthuochetou.php2.查詢字串 title input post.title 大概在 21 行左右,不同編輯器有區別 3.複製 diy director input post.d...

火車頭使用分頁採集有分頁的資料

分頁就是目標 上乙個文章分為好幾頁,我們需要設定規則將其全部採到。採集要點 1.採集規則要對每個分頁都適用。2.分頁規則如果是全部列出,只要第乙個頁面的分頁規則就可以了。如果是上下頁,每個頁面的分頁規則也要都適用。具體操作流程 先測試獲得所有分頁,再對每個分頁裡的內容進行獲取。下邊我們以為例來說明一...

火車頭採集文章並發布到DedeCMS

1.新建站點 2.在該站點上新建任務 3.規則,檢視一下源 發現這些 在乙個區域裡,我們可以這樣寫規則 測試一下,正確,下邊該採內容了。4.內容規則製作。我們隨便找個頁面,如先測試一下 看了一下,裡邊是有我們需要的東西的,這說明火車可以採它。下邊做一下具體的內容採集規則。經分析我們可以得知,內容在i...