用Python模擬登陸GitHub並獲取資訊

2021-09-22 04:50:20 字數 1185 閱讀 1603

搜狗的反爬有點厲害,即使我用了高匿**,它還是會提醒我ip訪問過於頻繁,然後跳轉驗證碼頁面。

不過方法還是有的,通過其他搜狗搜尋**動態改變(乙個賬號沒辦法呀...)。

這裡先對github進行模擬登陸,了解會話及cookies相關知識。

/ 01 / 網頁分析

首先看一下登入頁,獲取authenticity_token引數值,是乙個隱藏式表單元素。

檢視登入頁的response headers,這裡的set-cookie欄位,是設定cookies的過程。這邊呢我的理解是,當你在session那個網頁填寫賬號和密碼後,這裡就會自動生成乙個cookies返回(其實我也很暈...)。

將preserve log開啟(表示顯示持續日誌),然後輸入賬號及密碼,找到session這個請求。最後得知請求的**及請求方式(post)。

這裡是session的請求頭和表單資訊,能看到生成的cookies資訊。

獲取使用者動態及個人資訊的網頁就不說了,簡單操作。

需要提的一點就是使用者動態的網頁是ajax請求,崔大的**過時了呀...

/ 02 / 資料獲取

實現**如下所示。

最後成功登陸,獲取動態及個人資訊。

/ 03 / 總結

搞了半天,其實對會話和cookies 還是暈暈的...

這裡對類的知識做個總結,平常函式用的多一點,類都沒怎麼接觸,需要好好回憶一下。

類(class): 用來描述具有相同的屬性和方法的物件的集合。它定義了該集合中每個物件所共有的屬性和方法。物件是類的例項。

類變數:類變數在整個例項化的物件中是公用的。類變數定義在類中且在函式體之外。類變數通常不作為例項變數使用。

例項變數:定義在方法中的變數,只作用於當前例項的類。

例項化:建立乙個類的例項,類的具體物件。

方法:類中定義的函式。

物件:通過類定義的資料結構例項。物件包括兩個資料成員(類變數和例項變數)和方法。

這回我也用上了github,其實好幾月前就註冊了,慢慢了解吧,以後原始碼網盤、github都會放。

python模擬登陸,用session維持回話

客戶端向伺服器傳送請求,cookie則是表明我們身份的標誌。而 訪問登入後才能看到的頁面 這一行為,恰恰需要客戶端向伺服器證明 我是剛才登入過的那個客戶端 於是就需要cookie來標識客戶端的身份,以儲存它的資訊 如登入狀態 1,先在瀏覽器中登入,然後開啟開發者選項,找到乙個請求方法為post的請求...

Python 模擬登陸

主要講述賬號密碼登陸,cookie登陸,3.cookie cookie 是伺服器對每個請求使用者的標識,伺服器可以通過cookie判斷請求使用者是不是同乙個人,經常我們登入 時,登陸成功以後我們關閉頁面,我們再次去進入這個頁面,已經是登入狀態了。cookie也有時效性,一定時間以後cookie就會失...

Python模擬登陸

這裡用知乎 www.zhihu.com 來測試的python的模擬登陸操作 首先用firefox和fiddler來攔截所有對知乎的請求,包括進入登陸的頁面的url www.zhihu.com signin 和登陸的url www.zhihu.com login phone num 檢視頁面的源 需要...