爬蟲4 cookie登陸並爬取學習成績

2022-06-24 20:24:14 字數 596 閱讀 2482

最近專案太忙了,都沒空繼續學習爬蟲,前幾天實驗了各種姿勢帶cookie去登陸,都沒有成功,不明覺厲

依然沒有放棄,今天用同樣的辦法登陸以前大學的**居然成功了,我真是一臉懵逼

又看了一遍以前的學習成績,真是恨不得給自己兩耳屎,青春都讓狗吃了

哦,對了,以前還有一段學selenium的學習筆記,空了整理放到裡面來

#

-*- coding:utf-8 -*-

import

requests

from bs4 import

beautifulsoup

head=

#url = ''

#req = requests.get(url, headers=head)

detail = requests.get('

',headers=head).text

soup = beautifulsoup(detail, "

html.parser")

blist = soup.find_all('b'

)for item in

blist:

print item.get_text()

爬蟲 cookie模擬登陸

cookie 適用於抓取需要登入才能訪問的頁面 http協議為無連線協議,cookie 存放在客戶端瀏覽器,session 存放在web伺服器 1 先登入成功1次,獲取到攜帶登陸資訊的cookie 登入成功 個人主頁 f12抓包 重新整理個人主頁 找到主頁的包 home 一般cookie都在all ...

自動登陸 Cookie

再來兩句 cookie是由servlet api提供的類,是web伺服器傳送給客戶端的一小段資訊。客戶端在請求時,可以讀取資訊併發送到伺服器端,cookie中包含多個名稱 值對,伺服器傳送乙個cookie時,客戶端可以接受並儲存這個cookie。伺服器可以設定cookie的名稱 值 存活時間以及版本...

爬蟲 新浪微博(登陸訪問 cookie訪問)

一 思路 登入 進入指定頁面 獲取cookie 帶cookie訪問相關頁面。注 貌似微博頁面稍微改了一下 現在通過登入直接進入個人中心的過程中所獲取的cookie不能用於訪問其他頁面,因此,才會在登陸後加一層進入指定頁面用於獲取可用的cookie。二 1 登入並獲取cookie url 2 cook...