python 爬蟲小疑問（未完待續）

q 1 :web crawling和web scraping的區別在**？

a 1：簡單來說，web crawling指的僅僅是使用爬蟲機械人來索引網頁，檢視網頁的資訊，類似搜尋引擎的工作；而web scraping涉及到資料提取，儲存，計算等技術。scrapy 是web scrapying常用的乙個框架。

q2：爬蟲基本教程？

a2：step 1 : 使用urllib包得到網頁原始碼

step 2 : 把原始碼放進bs包裡，得到乙個soup

step 3：使用soup來得到各種標籤的內容

以上就是簡單的爬蟲步驟

q3：什麼是beautiful soup？

q3：在step1中得到的網頁，一般來說可以自行使用正規表示式來進行解析網頁，比如寫乙個定位< p > 標籤或者< a > 標籤。但是很費時間，這時候，beaufifulsoup是乙個已經寫好了的包，可以直接使用。bs裡面有html解析器，xml解析器等。可以很方便的使用

q4 ：什麼是scrapy？

a4：正如第一問所說, scrapy是乙個常用的商業框架，不僅可以簡單的爬取資料，還可以進行大量的資料處理，儲存，分析等功能。

python 爬蟲小疑問 （未完待續）