編寫Python爬蟲爬取豆瓣出版社列表並寫入檔案

本文介紹了如何編寫python程式從**』爬取豆瓣出版社列表並寫入檔案：

import requests,re
from bs4 import beautifulsoup
def gethtmltext(url,code='utf-8'):
try:
r=requests.get(url,timeout=30)
r.raise_for_status
if r.encoding != code:
r.encoding = code
return r.text
except:
print("爬取失敗\n")
return ""
def main():
hrefpath='出版商.txt'
with open(hrefpath,'w',encoding='utf-8') as f:
url=''
html=gethtmltext(url,code='utf-8')
soup=beautifulsoup(html,'html.parser')
info=re.compile('(.+?)
').findall(str(soup))
for i in info:
f.write(i)
f.write('\n')
main()

人民東方出版傳媒人民文學雜誌社上海九久讀書人世紀文景四川數字出版傳媒**** 上海譯文出版社時代華文上海雅眾文化世紀文睿時代華語商務印書館生活·讀書·新知三聯書店上海社會科學院出版社社會科學文獻出版社山西春秋電子音像出版社雁北堂陝西人民出版北京分公司《書城》雜誌世界圖書出版公司北京公司四川文藝出版社上海文藝出版社上海人民出版社上海交通大學出版社斯坦威圖書上海人民美術出版社圖靈社群 trajectory 武漢大學出版社北京分社萬有圖書未讀新星出版社新華先鋒文化傳媒雪球懸疑世界現代出版社西南財經大學出版社新華出版社新華先鋒出版科技譯林出版社譯言·東西文庫譯言·古登堡計畫悅讀紀陽光部落格悅讀名品燕山出版社閱文集團華文天下中信出版社中國人民大學出版社中作華文中國輕工業出版社紫圖圖書浙版數媒 **編譯出版社知乎中國國家地理圖書部浙江攝影出版社中國經濟出版社中國青年出版社中國民主法制出版社中國傳媒大學出版社中國言實出版社浙江大學出版社

湛廬文化

編寫Python爬蟲爬取豆瓣出版社列表並寫入檔案

Python爬蟲爬取豆瓣電影（二）

python爬蟲爬取豆瓣電影資訊

爬蟲豆瓣電影爬取案例

編寫Python爬蟲爬取豆瓣出版社列表並寫入檔案

Python爬蟲 爬取豆瓣電影（二）

python爬蟲爬取豆瓣電影資訊

爬蟲 豆瓣電影爬取案例

相關推薦

Python爬蟲爬取豆瓣電影（二）

爬蟲豆瓣電影爬取案例