使用正規表示式,取得點選次數,函式抽離

2022-06-04 18:45:11 字數 2512 閱讀 3227

1. 用正規表示式判定郵箱是否輸入正確

r = '^(\w)+(\.\w+)*@(\w)+((\.\w))$'

e = '[email protected]'

if re.match(r,e):

print(re.match(r,e).group(0))

else:

print('error!')

2. 用正規表示式識別出全部**號碼。

str = '羅德廣的號碼020-123456, 藝術大師0759-3877878,你的號碼0658-3877456,位址號012648945614685789'

tel = re.findall('(\d)-(\d)',str)

print(tel)

3. 用正規表示式進行英文分詞。re.split('',news)

words = re.split('[\s,.:;!?"]',news)

print(words)

4. 使用正規表示式取得新聞編號

5. 生成點選次數的request url

6. 獲取點選次數

7. 將456步驟定義成乙個函式 def getclickcount(newsurl):

import requests

import re

newsurl = ''

def getclickcount(newsurl):

newsid = re.search('\_(.*).html',newsurl).group(1).split('/')[-1]

res = requests.get(''.format(newsid))

return(int(res.text.split('.html')[-1].lstrip("(')").rstrip("');")))

print(getclickcount(newsurl))

8. 將獲取新聞詳情的**定義成乙個函式 def getnewdetail(newsurl)

def getnewdetail(newsurl):

resd = requests.get(newsurl)

resd.encoding = 'utf-8'

soupd = beautifulsoup(resd.text, 'html.parser')

title = soupd.select('.show-title')[0].text

info = soupd.select('.show-info')[0].text

else:

wr = 'none'

if info.find('攝影:') > 0:

ph = info[info.find('攝影:'):].split()[0].lstrip('攝影:')

else:

ph = 'none'

else:

source = 'none'

content = soupd.select('.show-content')[0].text.strip()

click = getclickcount(newsurl)

9. 取出乙個新聞列表頁的全部新聞 包裝成函式def getlistpage(pageurl):

newsurl = ''

def getlistpage(newsurl):

res = requests.get(newsurl)

res.encoding = 'utf-8'

soup = beautifulsoup(res.text, 'html.parser')

for new in soup.select('li'):

if len(new.select('.news-list-title'))>0:

newsurl = new.select('a')[0].attrs['href']

getnewdetail(newsurl)

getlistpage(newsurl)

10. 獲取總的新聞篇數,算出新聞總頁數包裝成函式def getpagen():

def getpagen():

res = requests.get('')

res.encoding = "utf-8"

soup = beautifulsoup(res.text, 'html.parser')

n = int(soup.select('#pages')[0].select('a')[0].text.rstrip('條'))

return (n // 10 + 1)

11. 獲取全部新聞列表頁的全部新聞詳情。

getlistpage(newsurl)

n = getpagen()

for i in range(n-1, n+1):

print(i)

listpageurl = '{}.html'.format(i)

getlistpage(listpageurl)

使用正規表示式,取得點選次數,函式抽離

1.用正規表示式判定郵箱是否輸入正確。importre defvalidateemail email if len email 7 if re.match a za z0 9 a za z 0 9 email none print good return 1 return 0 print exit ...

使用正規表示式,取得點選次數,函式抽離

學會使用正規表示式 1.用正規表示式判定郵箱是否輸入正確。r w w w w e 67890222 qq.com if re.match r,e print re.match r,e group 0 else print 非郵箱格式!2.用正規表示式識別出全部 號碼。3.用正規表示式進行英文分詞。r...

使用正規表示式,取得點選次數,函式抽離

1.用正規表示式判定郵箱是否輸入正確。r w w w w e 157049540 qq.com if re.match r,e print suc else print false 2.用正規表示式識別出全部 號碼。a re.findall d d str print a 3.用正規表示式進行英文分...