使用正規表示式,取得點選次數,函式抽離

2022-06-04 22:57:15 字數 2510 閱讀 3804

1. 用正規表示式判定郵箱是否輸入正確。

import re

r = '^(\w)+(\.\w+)*@(\w)+((\.\w))$'

e = '[email protected]'

s = '輸入郵箱正確:'

if re.match(r,e):

print(s,re.match(r,e).group(0))

else:

print('error')

2 .用正規表示式識別出全部**號碼。

numbers = re.findall("(\d)-(\d)", str)

print(numbers)

3. 用正規表示式進行英文分詞。re.split('',news)

str1 = 'hi man ,do you like van ,boy next door'

out = re.split(',|\s',str1)

print(out)

4. 使用正規表示式取得新聞編號

url = ""

news = re.findall("\_(.*).html", url)[0].split("/")[-1]

print(news)

5. 生成點選次數的request url

url2 = "".format(news)

print(url2)

6. 獲取點選次數

url2 = "".format(news)

res = requests.get(url2)

print(int(res.text.split(".html")[-1].lstrip("('").rsplit("');")[0]))

7. 將456步驟定義成乙個函式 def getclickcount(newsurl):

def getclickcount():

url = ""

newsid = re.findall("\_(.*).html", url)[0].split("/")[-1]

res1 = requests.get("".format(newsid))

return int(res1.text.split(".html")[-1].lstrip("('").rsplit("');")[0])

print(getclickcount())

8. 將獲取新聞詳情的**定義成乙個函式 def getnewdetail(newsurl):

def getnewdetail():

detail_res = requests.get("")

detail_res.encoding = "utf-8"

detail_soup = beautifulsoup(detail_res.text, "html.parser")

content = detail_soup.select("#content")[0].text

info = detail_soup.select(".show-info")[0].text

return content, info

print(getnewdetail())

9. 取出乙個新聞列表頁的全部新聞 包裝成函式def getlistpage(pageurl):

def getlistpage(pageurl):

res = requests.get(pageurl)

res.encoding = 'utf-8'

soup = beautifulsoup(res.text, 'html.parser')

for news in soup.select('li'):

if len(news.select('.news-list-title')) > 0:

g = news.select('a')[0].attrs['href']

print(g)

getnewsdetail(g)

10. 獲取總的新聞篇數,算出新聞總頁數包裝成函式def getpagen():

def getpagen():

res = requests.get('')

res.encoding = 'utf-8'

soup = beautifulsoup(res.text, 'html.parser')

pagenumber=int(soup.select('.a1')[0].text.rstrip('條'))

page = pagenumber//10+1

return page

11. 獲取全部新聞列表頁的全部新聞詳情。

pageurl=''

n=getpagen()for i in range(1,n+1):

print(i)

listpageurl='{}.html'.format(i)

getlistpage(listpageurl)

使用正規表示式,取得點選次數,函式抽離

1.用正規表示式判定郵箱是否輸入正確。importre defvalidateemail email if len email 7 if re.match a za z0 9 a za z 0 9 email none print good return 1 return 0 print exit ...

使用正規表示式,取得點選次數,函式抽離

學會使用正規表示式 1.用正規表示式判定郵箱是否輸入正確。r w w w w e 67890222 qq.com if re.match r,e print re.match r,e group 0 else print 非郵箱格式!2.用正規表示式識別出全部 號碼。3.用正規表示式進行英文分詞。r...

使用正規表示式,取得點選次數,函式抽離

1.用正規表示式判定郵箱是否輸入正確 r w w w w e 123456789 qq.com if re.match r,e print re.match r,e group 0 else print error 2.用正規表示式識別出全部 號碼。str 羅德廣的號碼020 123456,藝術大師...