爬取牛客題目及對應的題號等資訊

這個例項和上乙個例項差不多，首先我們來到題目列表，觀察一下鏈結可以發現，對於不同頁的題目來說，鏈結只有page變數有所改變，第一頁為1，第二頁為2等。那麼我們可以通過改變page後的值來獲取不同頁的內容。我們觀察一下每一頁內容可以發現，題目資訊都在乙個td標籤內，那我們就可以找出所有的td標籤，取出其中的字串，去掉空字串。然後我們可以發現每五個字串對應乙個題目的資訊，所以我們每五個作為一組進行處理，即可得到每乙個題目的資訊。

**如下：

import
requests
from bs4 import
beautifulsoup
defgethtmltext(url):
try:
headers = 
response = requests.get(url, headers=headers)
return
response.text
except
: 
return
''def
parsehtml(html):
soup = beautifulsoup(html, '
html.parser')
tds = soup.find_all('td'
) infolist =
info =
cnt =0
for td in
tds:
txt =td.get_text()
txt = txt.split('\n'
) temp =
for text in
txt:
if text == ''
: 
continue
if temp ==:
continue
cnt += 1
for t in
temp:
if cnt == 5:
cnt =0
info =
return
infolist
defmain():
base_url = '
'infolist =
for i in range(1, 51):
url = base_url +str(i)
html =gethtmltext(url)
infolist +=parsehtml(html)
for info in
infolist:
print
(info)
main()

爬取牛客題目及對應的題號等資訊

牛客網模擬面試的題目1

Python爬取登入後的OJ練習中的題目資料

牛客網面經題題目及答案總結資料庫篇

爬取牛客題目及對應的題號等資訊

牛客網模擬面試的題目1

Python爬取登入後的OJ練習中的題目資料

牛客網面經題題目及答案總結 資料庫篇

相關推薦

牛客網面經題題目及答案總結資料庫篇