YouTube評論抓取

其中的加密引數分為 (ctoken, continuation這兩個引數一致), itct

現在整個api獲取成功了，最關鍵的一步到了，session_token的值，session_token同樣在源**裡面，搜尋xsrf_token

cookie的獲取方式

res = requests.get("") # 替換*
for key, value in res.cookies.items():
print(key + '=' + value)
#結果consent=執行出結果
gps=執行出結果
visitor_info1_live=執行出結果
ysc=執行出結果
我們需要的是cookie的引數是 'visitor_info1_live=*;ysc=*;__secure-3psid=*;consent=yes+hk.zh-cn+202011' 替換*
前兩個引數的獲取方式上面有，後面的 '__secure-3psid' 個人猜測是賬號或者裝置的加密key，在請求中獲取，'consent' 這個是 展示語言 + 時間 屬性.

源**就不發了，自己操作一遍就能明白，學會了是自己的，在這裡祝大家步步高公升。

注意這裡是post請求 , cookie: data:

}

這是結果

抓取大眾點評評論

獲取每個字代表的偏移量 def get font dict 獲取每個字代表的偏移量 return url url r requests.get url,headers headers font list re.findall r.text font dict for font in font lis...

大眾點評評論抓取 CSS加密破解

這裡我們看到了jazj3i這個變數對應的兩個畫素值 163.0px,89.0px 這很重要，先記下來。在這裡我們看到了乙個鏈結。url 你會發現，返回的是一些數字。現在直接看源可以看到這裡面的幾個關鍵數字 font size 字型大小還有y的值，y是個閾值，起的是個控制的作用。jazj3i這個變...

Python抓取豆瓣《白夜追兇》的評論並且分詞

相關提交到github上個人github上相關python的專案 coding utf 8 import requests from lxml import etree import jieba header def getpagenum url if url req requests.get ...

YouTube評論抓取

抓取大眾點評評論

大眾點評評論抓取 CSS加密破解

Python抓取豆瓣《白夜追兇》的評論並且分詞

相關推薦