爬取網頁資料 插敘 爬取網頁資料,給寶寶取個好名字

2021-10-12 09:14:33 字數 945 閱讀 8164

前言

應用例項

# 匯入模組import requestsfrom bs4 import beautifulsoup# 填寫頭請求,包括爬取網頁**headers = result = # 暫定爬取9頁名字for i in range(1,10):        url = ""+ str(i)+".html"    r = requests.get(url,headers=headers,timeout=10000)    print(str(i),"響應碼狀態:",r.status_code)    soup = beautifulsoup(r.text,"lxml")# 獲取名字節點    z = soup.find_all("div",class_="btn btn-default btn-lg namelist")    for z1 in z:        k=z1.text.strip()        print(k,end = ",") # 匯出檔案為title.txt的檔案,當然為了方便觀察可以選擇匯出csv格式        with open(r"c:\users\administrator\desktop\title.txt","a+",encoding = "utf-8-sig") as f:            f.write(k+",")            f.close()
輸出結果

end

java網頁資料爬取

在瀏覽器書籤中有許多經典的東西,有時候什麼忘記了需要去查詢的,也非常方便,但是痛苦的事情是某一天開啟書籤,居然那個頁面不知道飛哪去了,打不開,作為乙個程式設計師,當然不能容忍這種事情發生,那就把它們都爬下來。首先我們的書籤可能有幾種分類,為了處理方便,可以手動刪除我們不需要的,也可以程式處理一下 以...

nodeJs爬取網頁資料

發現node可以爬蟲,正好我在找暑期實習,然後就使用node爬一下 資料找實習。爬取目標 載入http模組 目標 嘿嘿,這個 有很多實習職位 http的get請求乙個目標 函式的引數是response,繫結兩個事件,乙個 data 事件,會不斷觸發獲取資料,資料獲取完觸發 end 事件。爬到的的資料...

python爬取網頁資料

import refrom urllib.request import urlopen 爬取網頁資料資訊 def getpage url response urlopen url return response.read decode utf 8 defparsepage s ret re.find...