爬蟲中國大學排名

2022-07-11 00:27:09 字數 1518 閱讀 9305

from pip._vendor import requests

print('訪問谷歌** 獲取response物件')

r = requests.get("")

x = 1

while x <= 20:

print('第' + str(x) + '次的返回狀態列印:' + str(r.status_code))

print('第' + str(x) + '次的text()列印:' + str(r.text))

print('第' + str(x) + '次的text()屬性長度列印:' + str(len(r.text)))

print('第' + str(x) + '次的content屬性長度列印:' +str(len(r.content)))

(3)html頁面

作業2完成!

贊!

(4)爬中國大學排名**內容

import requests

from bs4 import beautifulsoup

alluniv =

def gethtmltext(url):

try:

r = requests.get(url, timeout=30)

r.raise_for_status()

r.encoding = 'utf-8'

return r.text

except:

return ""

def fillunivlist(soup):

data = soup.find_all('tr')

for tr in data:

ltd = tr.find_all('td')

if len(ltd) == 0:

continue

singleuniv =

for td in ltd:

def printunivlist(num):

print("^10}^6}^4}^10}".format(chr(12288), "排名", "學校名稱", "省市", "總分", "年費"))

for i in range(num):

u = alluniv[i]

print("^10}^5}^8.1f}^11}".format(chr(12288), u[0], u[1], u[2], eval(u[3]), u[11]))

def main():

url = ' polytechnic normal university2020.html'

html = gethtmltext(url)

soup = beautifulsoup(html, "html.parser")

fillunivlist(soup)

printunivlist(10)

main()

中國大學排名定向爬蟲

功能描述 輸入 大學排名url鏈結 輸出 大學排名資訊的螢幕輸出 排名,大學名稱,總分 技術路線 requests bs4 定向爬蟲 僅對輸入url進行爬取,不擴充套件爬取 程式的結構設計 步驟1 從網路上獲取大學排名網頁內容 gethtmltext 步驟2 提取網頁內容中資訊到合適的資料結構 fi...

Python爬蟲 中國大學排名爬蟲

案例 import requests from bs4 import beautifulsoup import bs4 def gethtmltext url 爬取最好大學排名 內容 try r requests.get url,timeout 30 r.raise for status retur...

爬蟲例項(中國大學排名定向排名)

功能 輸出 大學排名資訊的螢幕輸出 排名,大學名稱,總分 技術路線 requests bs4 定向爬蟲 僅對輸入的url進行爬取,不擴充套件爬取 步驟 1.從網路上獲取大學排名網頁內容 2.提取網頁中資訊到合適的資料結構 3.利用資料結構展示並輸出結果 程式的結構設計 1.從網路上獲取大學排名網頁內...