python爬取京東評論

這不是我的第乙個爬蟲，但大多數都是像這樣簡單粗暴的，因為一開始對於定義函式，然後再進行相應的操作，是比較困難的，這能直接寫for迴圈語句。

然後，我們便開始進行相應的爬蟲第一步：

# 匯入必要的包
import requests
import json
# header這個的作用在於偽裝成瀏覽器進行操作，有些網頁識別到不是瀏覽器就不能訪問，user-agent能偽裝
# user-agent可以用不同個，一般在剛剛找網頁**url的headers的下面就有，當然也可以使用手機的，可網頁搜尋找到不同的user-agent，都能進行相應操作
url = ''
## 我們發現只有page在變化，根據這個我們可以進行翻頁爬取，我們先進行第一頁的操作
# 先向瀏覽器傳送請求
response = requests.get(url, headers=header)
data = response.text
# 由於爬取下來的data太大，就不展示了
jd = json.loads(data.lstrip('fetchjson_comment98vv12345(').rstrip(');'))
data_list = jd['comments']
for data in data_list:

out[1]: 13698518291 19年的願望終於實現了，買一台mac電腦，用起來體驗真的太棒了，非常流程，開關機超級快，用慣了win的我，習慣了幾天，現在可以輕鬆操作了，電池也非常耐用，可以用8小時以上不成問題，真是工作必備，超級滿意！ 2020-01-08 16:01:39 13843231135 執行速度：感覺比windows 快，蠻順暢螢幕效果：螢幕色彩真的是非常棒，真的無與倫比!! 散熱效能：不太懂，但感覺可以,沒感覺到發熱。外形外觀：看超來超薄，充滿立體感輕薄程度：感覺很薄，但能感覺出的分量充滿安全感

其他特色：音效是真的很立體很不錯！！！！ 2020-02-26 15:20:21

for page in range(0,10+1):
url = ''.format(page) 
response = requests.get(url, headers=header) 
data = response.text 
jd = json.loads(data.lstrip('fetchjson_comment98vv12345(').rstrip(');')) 
data_list = jd['comments'] 
for data in data_list: 
buyer_id = data['id'] 
content = data['content'] 
time = data['creationtime']

*注意：

*我們在獲取網頁響應時，網頁編碼是比較麻煩的，一般的如果是utf-8,我們就用text，若是亂碼，可以用content,獲得原始網頁，然後為了顯示正常，可以解碼content.decode(『gbk』),解碼還是看原始碼是什麼格式的。

python爬取京東評論

python爬取京東評論一

用Python爬取京東手機評論

京東爬取評論簡單分析

python爬取京東評論

python爬取京東評論 一

用Python爬取京東手機評論

京東爬取評論簡單分析

相關推薦

python爬取京東評論一