python爬蟲快速響應伺服器的做法

不論是開啟網頁或者爬取一些資料的時候，我們想要的是計算機能在最短的時間內執行出結果，不然等待的時間過長會影響下一步工作的計畫。這時候我們可以給計算機乙個指令，限制最久能等待的時間，在我們能接受的時間內執行出結果。那麼這個指令方法是什麼呢？接下來我們一起看看吧。

requests之所以稱為「http for human」，因為其封裝層次很高，其中一處體現就在：requests會自動處理伺服器響應的重定向。我在做搜狗微信***抓取的時候，搜狗搜尋列表頁面的***文章位址，其實不是微信的位址而需要請求到搜狗到伺服器做重定向，而requests的預設處理則是將整個過程全部搞定，對此可以這樣：

in [1]:rrdwwltqo r = requests.get('', allow_redirects=false)

allow_redirects引數為false則表示不會主動重定向。

另外，有時候對方**的響應時間太長了，我們希望在指定時間內完事，或者直接停止這個請求，這時候的做法是：

in [1]: r = requests.gerrdwwltqot('', timeout＝3)

timeout表示這次請求最長我最長只等待多少秒

拓展：為requests套上一層**的做法也非常簡單：

import requests

proxies =

requests.g程式設計客棧et("http://xl程式設計客棧zd.me", proxies=proxies)

python爬蟲快速響應伺服器的做法

伺服器響應

AJAX 伺服器響應

AJAX 伺服器響應

python爬蟲快速響應伺服器的做法

伺服器響應

AJAX 伺服器 響應

AJAX 伺服器響應

相關推薦

AJAX 伺服器響應