YouTube評論抓取

2021-10-17 02:36:58 字數 929 閱讀 7333

其中的加密引數分為 (ctoken, continuation這兩個引數一致), itct

現在整個api獲取成功了,最關鍵的一步到了,session_token的值,session_token同樣在源**裡面,搜尋xsrf_token

cookie的獲取方式

res = requests.get("") # 替換*

for key, value in res.cookies.items():

print(key + '=' + value)

#結果consent=執行出結果

gps=執行出結果

visitor_info1_live=執行出結果

ysc=執行出結果

我們需要的是cookie的引數是 'visitor_info1_live=*;ysc=*;__secure-3psid=*;consent=yes+hk.zh-cn+202011' 替換*

前兩個引數的獲取方式上面有,後面的 '__secure-3psid' 個人猜測是賬號或者裝置的加密key,在請求中獲取,'consent' 這個是 展示語言 + 時間 屬性.

源**就不發了,自己操作一遍就能明白,學會了是自己的,在這裡祝大家步步高公升。

注意這裡是post請求

, cookie:

data:

}

這是結果

抓取大眾點評評論

獲取每個字代表的偏移量 def get font dict 獲取每個字代表的偏移量 return url url r requests.get url,headers headers font list re.findall r.text font dict for font in font lis...

大眾點評評論抓取 CSS加密破解

這裡我們看到了jazj3i這個變數對應的兩個畫素值 163.0px,89.0px 這很重要,先記下來。在這裡我們看到了乙個鏈結。url 你會發現,返回的是一些數字。現在直接看源 可以看到這裡面的幾個關鍵數字 font size 字型大小 還有y的值,y是個閾值,起的是個控制的作用。jazj3i這個變...

Python抓取豆瓣《白夜追兇》的評論並且分詞

相關 提交到github上 個人github上相關python的專案 coding utf 8 import requests from lxml import etree import jieba header def getpagenum url if url req requests.get ...