python爬蟲小結

2021-07-16 14:53:01 字數 331 閱讀 2119

之前在學校鼓搗兩個周的爬蟲還沒入門，前倆周王哥給點撥了下，有種茅塞頓開的感覺。

現針對小白入門階段總結下經驗

爬蟲的概念不須說，之前不懂構造請求這回事，工欲善其事，必先利其器，首先可以利用fiddler(charles和firebug都很厲害)觀察瀏覽器請求頁面過程的請求，觀察哪個才是需要構造的，觀察是get還是post，觀察request的headers和cookies，再利用python的requests庫中的方法發出請求，如果仍請求不到頁面可在requests.get()方法中使用proxies引數，將**之鄉fiddler，觀察爬蟲的請求和瀏覽器的請求有什麼差別，從而修改**

附兩周成果位址

16Python爬蟲 Scrapy小結

1 我們可以通過scrapy startproject h調出startproject的幫助資訊，在這裡可以看到scrapy startprojcct具體可以新增哪些引數。2 如果我們想要刪除某個爬蟲專案,我們可以直接刪除該爬蟲項日對應的資料夾即可方式。3 可以使用 genspider命令來建立 s...

網路爬蟲小結

python中可以用來爬取網路資料的庫有很多，常見的有 urllib urllib2 urllib3 requests scrapy selenium等。基本上可以分為3類第一類 urllib urllib2 urllib3 requests 第二類 scrapy 第三類 selenium 第一類...

python小結 python小結

c python33新增到你的path 環境變數中，你可以在dos 視窗中輸入以下命令 set path path c python33 id 方法的返回值就是物件的記憶體位址。在行首行後插入至少一行特殊的注釋行來定義原始檔的編碼。coding encoding sys.modules 模組...