Python 爬蟲練手專案 酒店資訊爬取

2022-09-02 13:09:07 字數 2484 閱讀 1725

from bs4 import beautifulsoup

import requests

import time

import re

url = ''

urls = [''.format(str(i)) for i in range(1,10)] # 最多157頁

infos =

# print(urls)

# 批量爬取資料

def getaurl(urls):

data_number = 0

for url in urls:

getattractions(url)

print('--------------{}-----------------'.format(len(infos)),sep='\n')

# 爬取當頁面資料

def getattractions(url,data = none):

web_data = requests.get(url)

time.sleep(2)

soup = beautifulsoup(web_data.text,'lxml')

# print(soup)

hotel_names = soup.select('ul.shhotellist.clearfix > li > h2 > a')

hotel_images = soup.select('span[class="pic"] > a > img')

hotel_points = soup.select('span[class="points"]')

hotel_introduces = soup.select('p[class="comment"]')

hotel_prices = soup.select('p[class="seemore"] > span > em')

if data == none:

for name,image,point,introduce,price in \

zip(hotel_names,hotel_images,hotel_points,hotel_introduces,hotel_prices):

data =

# print(data)

# 根據**從高到低進行排序

def getinfosbyprice(infos = infos):

infos = sorted(infos, key=lambda info: info['price'], reverse=true)

for info in infos:

print(info['price'], info['name'])

# getattractions(url)

爬取的**鏈結

窮遊網遇到的問題及解決辦法

①strip()方法用於刪除開始或結尾的字元。lstrip()|rstirp()分別從左右執行刪除操作。預設情況下會刪除空白或者換行符,也可以指定其他字元。

②如果想處理中間的空格,需要求助其他技術 ,比如replace(),或者正規表示式

③strip()和其他迭代結合,從檔案中讀取多行資料,使用生成器表示式

④更高階的strip 

可能需要使用translate()方法

2. 【**】python:object of type 'response' has no len(),如何解決?

①strip()方法用於刪除開始或結尾的字元。lstrip()|rstirp()分別從左右執行刪除操作。預設情況下會刪除空白或者換行符,也可以指定其他字元。

②如果想處理中間的空格,需要求助其他技術 ,比如replace(),或者正規表示式

③strip()和其他迭代結合,從檔案中讀取多行資料,使用生成器表示式

④更高階的strip 

可能需要使用translate()方法

Python練手專案0011

敏感詞文字檔案 filtered words.txt,裡面的內容為以下內容,當使用者輸入敏感詞語時,則列印出 freedom,否則列印出 human rights。coding utf 8 created on thu jan 12 13 55 35 2017 author sky def tran...

python 微信爬蟲 python 微信爬蟲例項

import urllib.request import urllib.parse import urllib.error import re,time import queue import threading operner urllib.request.build opener operner...

10個python練手專案

標記一下python的練手專案 10個python練手專案 python專案練習一 即時標記 python專案練習二 畫幅好畫 python專案練習三 萬能的xml python專案練習四 新聞聚合 python專案練習五 虛擬茶話會 python專案練習六 使用cgi進行遠端編輯 python專案...