Python安全筆記(一)

2021-09-02 23:20:23 字數 1664 閱讀 4156

beatifulsoup是常用的python的擴充套件包,用於對web檔案格式化顯示、按條件查詢等功能。它是bs4包中的一部分,使用前需安裝bs4:

pip install bs4
並在python程式中匯入:

print(beatifulsoup.prettify()) //將html檔案按縮排格式顯示2.2 對網頁按標籤、按屬性、按內容檢索

例子:

html_doc = '''

the dormouse's story

hello world

once upon a time,there were three little sisters,and their names were

elsie,

lacieand

tillie;

and they lived at the bottom of a well.

...'''

2.2.1 檢索出所有p標籤的內容

1)列印出所有名稱為「p」的標籤,結果可以按列表的方式使用,比如使用index

soup=beautifulsoup(html_doc, "html.parser")

print(soup.find_all("p"))

2) 列印出所有名稱為「p」的標籤中的第乙個

print(soup.find_all("p")[0]  

結果為:

the dormouse's story

3)分行列印出所有名稱為「a」的標籤,

for i in soup.find_all(「a」):

print(i)

結果為 elsie

lacie

tillie

4)也可以結合正規表示式用,以下返回名稱以p開頭的標籤:

soup.find_all(re.compile("^p")
5)可以根據內容檢索,以下列印出包含id=link2的標籤:

print(soup.find_all(id="link2"))

結果為:

[lacie]

列印出包含"id=link2"的標籤中的href元素:

print(soup.find_all(id="link2")[0]["href"])

結果為:

6) 可以根據標籤中含的多個元素聯合查詢,以下列印出「id=link2」且「class="sister"的標籤(注意class要寫成class_):

print(soup.find_all(id="link2",class_="sister"))

結果是:

[lacie]

Python安全筆記(二)

出現以上錯誤的 r requests.get verify false cont r.content o open test.html w o.write cont 原因猜測 因為open以寫模式開啟檔案時,預設是設該檔案為strings格式,因此write的引數只能為str格式,而r.conten...

資訊保安 複習筆記(一)

單向函式 1.單向函式 1 計算f x 容易計算 2 計算f x 的逆即通過y求解 x困難2.hash函式的定義和發展現狀 1 訊息任意長,hash值定長 2 單向性 不可逆計算 弱抗碰撞 找到相同mssage的 h值相同不可行 強抗碰撞性 任意兩個 mssage的h 值相同不可能 3 分類 改動檢...

執行緒安全筆記一 執行緒安全概念

個人理解 執行緒安全是指一段 或程式,在多執行緒的情況下執行時,仍然能做出所期望的結果或行為。也就是說,如果一段 或程式是單執行緒的,則他必定是執行緒安全的。換句話說,執行緒安全都是指的多執行緒。需要考慮執行緒安全的程式,必定是多執行緒的。但不是所有的執行緒安全的程式都需要考慮執行緒安全問題。只有在...