最最簡潔的乙個python爬蟲

2021-09-19 13:42:43 字數 1008 閱讀 8701

安裝了python,就是衝著爬蟲去的,那麼就來敲乙個爬蟲吧!!!

如果某位同學沒有安裝python3,請移步我的部落格python安裝前去安裝python3.7.....

安裝好了,那麼,win+r開啟cmd,是的,我們就在cmd中寫,因為只有五行**(手動滑稽)

1、輸入python執行python3

2、寫程式肯定先寫標頭檔案吧,那麼寫上import urllib.request

(這個request呢,就是python給的乙個現成的非常好用的庫urllib下的乙個非常好用的乙個模組,包含著我們這次寫的urlopen函式,大家可以試著了解一下urllib庫)

3、我們先去找乙個想看的**,就去b站吧......

(乙個青島大學的資料結構老師的主頁)

那我們就看看這個主頁下的原始碼吧!!!

在cmd寫上html = urllib.request.urlopen("")

4、html變數再讀出來吧!!!寫上 ht = html.read()

5、那麼輸出ht試試啊,寫print(ht)試試,d(őдő๑),這***真亂啊,不過定睛一看,欸,b開頭,這不是二進位制嗎,轉一下碼唄!!

6、輸入ht1 = ht.decode('utf-8') 轉一下utf-8,然後在print(ht1)   ( ゜- ゜)つロ

乙個簡單的Python爬蟲

乙個簡單測試爬蟲的網頁 1.獲取 的html import urllib.request request urllib.request.urlopen str request.read print str 2.返回網頁標題 輸出目標網頁內title標籤內的文字 gettitle 函式返回網頁的標題,...

python爬蟲 第乙個爬蟲

1.本地安裝了nginx,在預設的html目錄下建立測試html 如圖,即index.html導向a,b,c 3個html,a.html又可以導向aa,bb兩個html,c.html可以導向cc.html。2.修改nignx配置使得本地可以訪問寫的kmtest裡的index.html。參考文件 ng...

Python爬蟲的乙個編碼問題

今天在爬取 博時楊銳 這個網頁的時候,程式報錯 unicodeencodeerror ascii codec can t encode characters in position 32 34 ordinal not in range 128 我以為這是程式編碼的問題。結果根據報錯的 尋找到的結果發...