Python學習之爬蟲基礎

第0步：

獲取資料：通過requests庫來獲取資料

requests.get()用法

import requests
#引入requests庫
res = requests.get('url')
#requests.get是在呼叫requests庫中的get()方法，它向伺服器傳送了乙個請求，括號裡的引數是你需要的資料所在的**，然後伺服器對請求作出了響應。
#我們把這個響應返回的結果賦值在變數res上。

res是乙個物件，response通常有四種屬性，

#發出請求，並把返回的結果放在變數res中

pic=res.content

#把reponse物件的內容以二進位制資料的形式返回

#新建了乙個檔案ppt.jpg，這裡的檔案沒加路徑，它會被儲存在程式執行的當前目錄下。

#內容需要以二進位制wb讀寫。

photo.write(pic)

#獲取pic的二進位制內容

photo.close()

#關閉檔案

例：
import requests
#引用requests庫
res = requests.get('')
novel=res.text
#把response物件的內容以字串的形式返回
k = open('《三國演義》.txt','a+')
#建立乙個名為《三國演義》的txt文件，指標放在檔案末尾，追加內容
k.write(novel)
#寫進檔案中 
k.close()
#關閉文件

res.encoding能定義response物件的編碼型別

那在真實的情況中，我們該在什麼時候用res.encoding呢？

首先，目標資料本身是什麼編碼是未知的。用requests.get()傳送請求後，我們會取得乙個response物件，其中，requests庫會對資料的編碼型別做出自己的判斷。但是！這個判斷有可能準確，也可能不準確。

如果判斷準確的話，我們列印出來的response.text的內容就是正常的、沒有亂碼的，那就用不到res.encoding；如果判斷不準確，就會出現一堆亂碼，那我們就可以去檢視目標資料的編碼，然後再用res.encoding把編碼定義成和目標資料一致的型別即可。

總的來說，就是遇上文字的亂碼問題，才考慮用res.encoding.

Python學習之爬蟲基礎

Python爬蟲之Scrapy學習（基礎篇）

python爬蟲之入門基礎

Python爬蟲基礎之requestes模組

Python學習之爬蟲基礎

Python爬蟲之Scrapy學習（基礎篇）

python爬蟲之 入門基礎

Python爬蟲基礎之requestes模組

相關推薦

python爬蟲之入門基礎