動態抓取網頁資訊

前幾天在做資料庫實驗時，總是手動的向資料庫中新增少量的固定資料，於是就想如何向資料庫中匯入大量的動態的資料？在網上了解了網路爬蟲，它可以幫助我們完成這項工作，關於網路爬蟲的原理和基礎知識，網上有大量的相關介紹，本人不想在累述，個人覺得下面的文章寫得非常的好（網路爬蟲基本原理

一、網路爬蟲基本原理二）。

本部落格就以採集首頁的新聞部分為例吧。本例為了直觀簡單就採用mvc，將採集到的資料顯示到頁面中，（其實有好多小型**就是採用抓取技術抓取網上各自需要的資訊，再做相應的應用）。另外在實際的抓取過程中可以採用多執行緒抓取，以加快採集的速度。

採集後的結果：

抓取的原理：先獲取對應url頁面的html內容，然後根據找出你要抓取的目標資料的的html結構，看看這個結構是否有某種規律，然後用正則去匹配這個規則，匹配到了以後就可以採集出來。我們可以先看看頁面原始碼，可以發現新聞部分的規律：位於id="post_list"的之間

於是，我們便可以得到相應的正規表示式了。

"\\s*.*\\s*.*\\s*.*\\s*.*\\s*.*\\s*.*\\s*.*\\s*\\s*.*)\"\\s*target=\"_blank\">(?.*).*\\s*\\s*(?.*)\\s*

"原理很簡單，下面我就給出源**：線建立乙個mvc空專案，再在controller檔案下新增乙個控制器homecontroller,再為控制器新增乙個檢視index

homecontroller.cs部分**：

using system;
using system.collections.generic;
using system.io;
using system.net;
using system.text.regularexpressions;
using system.web.mvc;
catch (exception ex)
}public actionresult index()
}viewbag.list = list;
return view();}}
}

index檢視部分**：

@
標題內容
鏈結 @foreach (var a in viewbag.list)
else if(count==1)
else}}

動態抓取網頁資訊

php 抓取網頁資訊

Ajax動態網頁的資訊抓取（入門）

學習curl抓取網頁資訊

動態抓取網頁資訊

php 抓取網頁資訊

Ajax動態網頁的資訊抓取（入門）

學習curl抓取網頁資訊

相關推薦