用python獲取山東女子學院某一頁的學校要聞

2021-08-10 16:39:44 字數 1791 閱讀 3773

一、思路

觀察新聞列表頁面源**,用正規表示式篩選,找到所有新聞超連結的位址,儲存備用。

one asia財團理事長一行來校訪問

2017/11/03

學校召開校友分會換屆籌備工作排程會

2017/11/02

遍歷超連結位址,嘗試獲取每乙個新聞頁面的源**,用正規表示式篩選出關鍵內容

10月26日下午,基礎部黨總支在博雅樓會議室召開全體教職工會議,傳達學習黨的十九大精神。會議由基礎部黨總支書記潘建勳主持。

會上,首先由李慧芬教授作學習十九大精神專題輔導,從新的歷史方位、新的理論創新成果、新的主要矛盾、新的奮鬥目標、黨的建設新的總要求五個方面,對十九大報告的主要內容進行了解讀,闡釋了十九大在新的歷史起點上進行偉大鬥爭、建設偉大工程、推進偉大事業、實現偉大夢想具的重大現實意義和深遠歷史意義。隨後,與會教師以支部為單位進行分組討論座談,大家紛紛表示,十九大的報告立意高遠、內涵豐富、思想深刻,閃耀著馬克思主義真理的光輝,具有很強的前瞻性、戰略性和指導意義,是我們黨邁入新時代、開啟新征程、續寫新篇章的政治宣言和行動指南。今後一定要以永不懈怠的精神狀態,擁抱新時代,踐行新思想,扎扎實實把十九大精神全面落實到教育教學工作中。

潘建勳就基礎部黨總支進一步學習貫徹十九大精神作了部署安排,要求全體教職工深刻理解黨的十九大的重大政治意義、理論意義和實踐意義,把學習貫徹十九大精神作為一項長期任務,通過持續深入的學習貫徹,深刻領會精神實質,用十九大精神武裝頭腦,使十九大精神成為各項工作的行動指南;要把學習貫徹十九大精神同學習貫徹學校第二次黨代會精神結合起來,同基礎部的實際和工作重點結合起來,立足本職,履職盡責,紮實推進基礎部的黨建工作和教育教學改革,為落實立德樹人的根本任務,實現學校黨代會確定的各項目標任務、建設應用型地方特色名校貢獻力量。

二、**實現

#coding=utf-8

from urllib import request

import re

url_temp = input("please input your url:\n")

url = str(url_temp)

headers = #瀏覽器頭

req = request.request(url, headers=headers)

page = request.urlopen(req).read()#讀出返回內容

page = page.decode('utf-8')#以utf8解碼

key = r'(/info.*?.htm)'#正規表示式

key = re.compile(key)

result = key.findall(page)#正規表示式過濾內容得到字元組

#開始迴圈爬新聞內容

for item in result:

res = request.request(""+item, headers=headers)

article = request.urlopen(res).read()#讀出返回內容

三、反思初學python,語法並不熟悉

正規表示式沒學會。。。。

繼續努力

用Python獲取最新的省 市 縣

因為資料庫的資料資訊建於12年,很多地區 關係和名稱都跟不上了,讓我手動乙個個新增又覺得麻煩,怎麼說我也是乙個碼農而不是文員,上 usr bin env python coding utf 8 import requests from lxml import etree import sys imp...

用值獲取Python字典的鍵

python字典的操作中,用鍵值對的鍵獲取值的方法還是比較簡單的,例如 d print d 5 輸出結果為 c但由於值在字典中並不唯一,所以,查詢值對應的鍵則頗費周章,下面是乙個由值查鍵的函式,得出的對應輸入值的鍵的列表 def get keys by value the dict,the valu...

用python獲取楊輝三角

其實,在高中我們就學過楊輝三角,他的原理就是乙個數列元素的值對應上乙個相應數列元素 就是索引相同 的值加上前面乙個數列元素的值 def traingle x 需要列印第幾行的 x int x traingle list if x 1 traingle list 1 elif x 2 traingle...