看小說新技能Get 爬蟲練習

2021-10-14 10:31:42 字數 1357 閱讀 1402

想看**,但是****的廣告又層出不窮,點一頁出來乙個廣告,攔截廣告的操作我又不是很熟練,那就把**資源移動到沒有廣告的地方吧——我不寫**,但我是**的搬運工

搬運第一步,瞄準**,開啟f12,看看內容在**。

nice! 竟然光明正大的放在這兒,那就別怪我搬運了(魔鬼臉,嘿嘿^-^)

要搬就得全部搬走,先把每一章的**給他搬過來。上搬運工具,開啟python。瞄準**:

url = ''
請求響應:

每一章的**都在紅框這裡藏著,寫個正則全給他扒拉過來。)

temp = re.search('([\s\s]*?)',resp.text,re.m|re.i)

m1 = re.compile('(.*)

')temp = m1.findall(temp.group(1))`

好嘞,章節名和對應的**都扒拉過來了。(**說:請不要扒拉我*-*)

把他們分別存到兩個列表裡,一次就搬一章(畢竟我不會多執行緒,嗚嗚嗚,難過~-~)

響應請求之後,正則匹配紅框在的地方也就是正文,然後把空格和回車都替換好,網頁裡是用字母表示的。

然後,儲存到自己的.txt中,再次露出魔鬼笑-。

開始搬運,……………… 100% 成功!

竟然有十一兆,搬運好辛苦,把這個檔案發給手機,用自帶的看書工具開啟,嗯……一點廣告都沒了,可以安心看了,笑^-^,(僅作學習交流,不要做違法的事情哦!)

暴力搜尋 新技能get

最近新學習了一種新的求解的方法,就是暴力搜尋,在通常做題沒有很明確的思路的時候,通常都會採用的一種方式。我們知道,乙個問題的解空間通常對應的是一棵樹的方式進行組織的,那麼我們可以通過根據題目中的條件描述來掃瞄 樹中的每乙個結點,對應的就是將問題的所有可能的解進行掃瞄一遍,從中選出滿足要求的即為問題的...

新技能 get 使用 python 生成詞云

從技術上來看,詞云是一種有趣的資料視覺化方法,網際網路上有很多的現成的工具 coding utf 8 import jieba from wordcloud import wordcloud import matplotlib.pyplot as plt text from file open 檔案...

新技能get 在任意目錄執行NDK編譯

準備環境 首先,你得安裝了android的ndk編譯工具,假設你的ndk的根目錄在 opt android ndk 當然,最好你能在環境變數裡配置一下路徑,否則使用ndk build命令的時候,都得加上路徑的字首了。修改 bashrc export ndk home opt android ndk ...