python day3 爬取每日一句

2021-10-01 08:57:29 字數 1308 閱讀 8612

import requests

import re

from bs4 import beautifulsoup

url=''#每一期的鏈結共同的部分

words=['0']*1800#定義乙個長度為1800的列表,用來儲存每一句話,並初始化為全『0』

for i in range(0,100):

s=str(i)#數字型別轉為字串型別

print(i)

currenturl=url+s#當前期的鏈結

try:

res=requests.get(currenturl)

res.raise_for_status()

except requests.requestexception as e:#處理異常

print(e)

else:

html=res.text#頁面內容

soup = beautifulsoup(html,'html.parser')

a=soup.select('.one-titulo')#查詢期次所在的標籤

b=soup.select('.one-cita')#查詢「每日一句」所在的標籤

#print(b)

index=re.sub("\d","",a[0].string.split()[0])#從「vol.***」提取期次數值作為下標

#print(index)

if(index==''):

continue

#print(b[0].string.split())

words[int(index)]=b[0].string.split()#將該期「每日一句」存入列表

#print(words[int(index)])

print("begin!!!!!!!!!!!!!!!")

f=open('c:\\users\\lsy\\desktop\\one.txt','w')#將每句話寫入這個txt檔案中,先開啟

for i in range(1,1774):

if(words[i]=='0'):

continue

else:

print(words[i])

f.writelines('vol.'+str(i)+'\n')#寫入期次和換行

f.writelines(' ')#每句話開始空四格

f.writelines(words[i])#寫入該句話

f.writelines('\n\n')#換行,並空一行寫入下一句

f.close()#關閉檔案

刻意練習Python DAY3

1.python的列表中可以同時存放整形 浮點型 字串 列表。mix 1 小甲魚 3.14,1,2,3 2.向列表中新增元素 腰魚 member.extend 腰魚 小雪 member.insert 0,牡丹 3.從列表中刪除元素 member.remove 腰魚 del member 1 memb...

小白學習python Day3

與數學中的整數意義一致,可正可負,沒有範圍限制 pow x,y 計算x的y次方 十種進製表大形式 十進位制 二進位制 0b,0b 八進位制 0o,0o 十六進製制 0x,0x 帶有小數點及小數的數字,浮點數的取值範圍和小數精度都存在限制 浮點數間的運算存在不確定尾數 二進位制轉換問題 使用round...

學習Python Day3 迴圈

python中的迴圈有兩種 for迴圈和while迴圈。for 變數 in 序列 迴圈體說明 a.for in 關鍵字 固定寫法 b.變數 可以是任意變數 一般寫乙個新的變數 c.序列 python中容器型資料型別,例如 字串 列表 元組 字典 集合 迭代器 生成器 range等 d.冒號 固定寫法...