還是老老實實學個爬蟲先

2021-07-17 02:57:13 字數 931 閱讀 7406

之前想直接蒐羅一些原始碼來看,但是發現涉及的內容比較多,涉及哪些知識,根本沒什麼頭緒。找了網上的一些資料,還是覺得學了爬蟲再說。這的確是必經之路。

編寫請求:

第一種(不推薦)

import

urllib2

response

=urllib2

.urlopen

("")

print

response

.read()

第二種(推薦)

其實上面的urlopen引數可以傳入乙個request請求,它其實就是乙個request類的例項,構造時需要傳入url,data等等的內容。比如上面的兩行**,我們可以這麼改寫

12

3

4

5

import

urllib2

request

=urllib2

.request

("")

response

=urllib2

.urlopen

(request)

print

response

.read()

執行結果是完全一樣的,只不過中間多了乙個request物件,推薦大家這麼寫,因為在構建請求時還需要加入好多內容,通過構建乙個request,伺服器響應請求得到應答,這樣顯得邏輯上清晰明確。

作者對get,post方式也詳細描述了一番,解釋的不錯。

其實它們兩個就是安全與不安全的問題,後者是經過了urlencode處理過。

妹的,我換成微博首頁後使用cookie登入,報出https錯誤,我就重新編譯了openssl,參考但是還是沒什麼用,我就谷歌了下,終於讓我找到了,如果你寫入乙個txtx.py檔案,你就可以正常執行,如果你互動執行就會報錯

踏踏實實做事,老老實實做人

最近學術造假,學歷造假等各種造假風波不斷,其實這些事情對我們每個人來說,未必不是好事。它至少告訴我們應該老老實實做人,踏踏實實做事。不要急功近利,為了達到某種目的而不擇手段。學歷當然要高些好,但是質量還是需要,學歷是自己真正獲得的,還是買來的。記得在西安上學時,利文說過,有的人是教授 副教授,但是並...

老老實實做好備份才是硬道理

週末忽然發現有個資料庫出了問題,有 可疑 兩個字樣。重啟資料庫,問題依舊。上網查,一大堆,好複雜,怕整個sql都搞壞。我想了一下原因,估計是前兩天有個資料庫的日誌無線膨脹。我自作聰明地想,先將資料庫分離,然後再附加,看看行不行。結果不能分離,警告我要先還原或修復。我就先將資料庫離線,然後分離,成功分...

我們不是牛人,所以還是老老實實跟著興趣走吧

收藏,編輯前幾天周筠老師寫了篇部落格,她認為興趣十分重要,沒有興趣做不成事情。我對此十分同意,有親身經歷為證。更值得一提的是,這個親身經歷和技術或是職業方面的關係真不大,我對許多技術都感興趣,一時還真難找出對比反差明顯的東西。這次來說說我近幾個月找到 或者說 找回 的興趣,彈鋼琴。在看來,這對我來說...