Python爬蟲實戰 爬取鏈家網二手房資料

2021-10-09 15:42:03 字數 1704 閱讀 8314

買房裝修,是每個人都要經歷的重要事情之一。相對於新房交易市場來說,如今的二手房交易市場一點也不遜色,很多二手房的資訊剛剛掛出來,就被其他購房者拿下了。

爬取鏈家網二手房資訊

受害者位址

匯入工具

import requests

import parsel

import time

請求網頁,爬取資料

for page in range(1, 101):

time.sleep(1)

url = ''.format(page)

headers =

response = requests.get(url=url, headers=headers)

selector = parsel.selector(response.text)

lis = selector.css('.selllistcontent li')

dit = {}

for li in lis:

title = li.css('.title a::text').get()

dit['標題'] = title

positioninfo = li.css('.positioninfo a::text').getall()

info = '-'.join(positioninfo)

dit['開發商'] = info

houseinfo = li.css('.houseinfo::text').get()

dit['房子資訊'] = houseinfo

followinfo = li.css('.followinfo::text').get()

dit['發布週期'] = followinfo

price = li.css('.totalprice span::text').get()

dit['售價/萬'] = price

unitprice = li.css('.unitprice span::text').get()

dit['單價'] = unitprice

csv_writer.writerow(dit)

print(dit)

儲存資料

import csv

f = open('二手房資訊.csv', mode='a', encoding='utf-8-sig', newline='')

csv_writer = csv.dictwriter(f, fieldnames=['標題', '開發商', '房子資訊', '發布週期', '售價/萬', '單價'])

csv_writer.writeheader()

執行**,效果如下

Python爬蟲實戰之爬取鏈家廣州房價 03儲存

系列目錄 python爬蟲實戰之爬取鏈家廣州房價 01簡單的單頁爬蟲 python爬蟲實戰之爬取鏈家廣州房價 02把小爬蟲變大 這一小節主要講一下前面一直沒有實現的儲存,儲存主要分兩大類 檔案和資料庫。結合這次爬蟲的資料量及後期分析的需要,這次主要介紹sqlite。通過對sqlite資料庫的封裝,處...

爬取鏈家網房價資料

感覺最近做的東西好菜 隨便了。d 鏈家房價資料.csv wt newline encoding utf8 writer csv.writer fp writer.writerow 樓盤名 位址 房間格式 房間面積 起價 優點 defget html url try response requests...

Python實戰爬蟲 爬取段子

不管三七二十一我們先導入模組 段子所在的 import re import requests 如果沒這模組執行cmd pip install requests領域 web開發,爬蟲,資料分析,資料探勘,人工智慧 零基礎到專案實戰,7天學習上手做專案 獲取 的內容 段子所在的 import re im...