python爬蟲登入豆瓣(一)

2021-07-23 15:59:57 字數 721 閱讀 4730

使用 第三方庫 requests

通過使用 chrome 瀏覽器抓包,可以得到這個請求,將其中的 headers 和 data 提交。最後輸出到 douban.html 的檔案中,即可檢視登入的介面。這次請求是第一次登入,所有介面為提示修改個人資訊。

# 將賬號和密碼改為自己的帳號和密碼

data =

"host": "accounts.douban.com", \

"referer": ""}

r = requests.post(url, data=data, headers=headers)

with

open("douban_login.html", "w") as f:

print(r.text.encode("utf-8"), file=f)

# 將網頁源**轉化為 utf-8 輸出

也可根據相同的原理使用程式修改個人資訊。

最後有乙個小問題,網頁源** meta 標籤顯示編碼方式為 utf-8,最後也將字元轉化為 utf-8 輸出,但儲存在本地之後再用瀏覽器開啟卻是亂碼,將編碼方式改為 bg2312 之後就能正常**,不知道什麼原因,求指教 (^o^)/

python爬蟲 使用cookie登入豆瓣

64位win10系統,同時裝python2.7和python3.6兩個版本 本次使用python3.6 ide為pycharm,瀏覽器為chorme,使用的python第三方庫為requests 首先登陸豆瓣首頁,並且登入賬戶 注意練習爬蟲時最好用小號 右鍵檢查,點選network,然後按fn f5...

python爬蟲 豆瓣

在爬蟲時候,通過requests.get 得到不正確的狀態碼 4 表示出錯 異常狀態碼檢視 fr aladdin 4 19 用requests庫的get 函式抓取乙個你平時經常使用的 主頁,並檢視該 的爬蟲協議 如果有的話 預設答案是正確,你成功了嗎?fp.write r.content b.有些 ...

python 模擬豆瓣登入(豆瓣6 0)

最近在學習python爬蟲,看到網上有很多關於模擬豆瓣登入的例子,隨意找了乙個試了下,發現不能執行,對比了一下 和豆瓣 發現原來是豆瓣 做了修改,增加了反爬措施。首先看下要模擬登入的 開啟開發者模式 在賬號和密碼隨意填入資料 發現會傳送乙個post請求 ur是 資料格式是 於是可以來編寫 impor...