BeautifulSoup的簡單用法

2022-04-01 06:02:40 字數 806 閱讀 3362

官方文件載入比較慢(估計是我黨的原因)

2、匯入模組

from bs4 import beautifulsoup

3、使用beautifulsoup獲取標籤中的text

from bs4 import

beautifulsoup

s1 = """

在紀錄表上,火箭少女中包括孟美岐、吳宣儀、楊超越、段奧娟、yamy、賴美雲、張紫寧及李紫婷,在身高、體重的字段上都有至少一項的資料,不過除了賴美雲之外,其他像孟美岐、吳宣儀等人的身高都比官方公布的數字矮1到3厘公尺,像楊超越官方數字是168厘公尺,但實際身高是166.5厘公尺。

"""bs = beautifulsoup(s1, "

html.parser")

print(bs.text)

目的:從html檔案提取文字

4、作用:去除指定的標籤,目的:富文字框防止xss攻擊

from bs4 import

beautifulsoup

bs = beautifulsoup(s1, "

html.parser")

ret =bs.text

#print(ret)

ret =bs.find_all()

print

(ret)

for tag in

bs.find_all():

print

(tag.name)

if tag.name == "

script":

tag.decompose()

資料解析模組BeautifulSoup簡單使用

1 準備測試頁面test.html html head title the dormouse s story title head body p class title b the dormouse s story b p p class story once upon a time there w...

Python的BeautifulSoup庫的使用

python爬蟲的beautifulsoup庫的使用 以下為爬去985高校的例子 import requests from bs4 import beautifulsoup 從bs4中引入beautifulsoup庫 import re url r requests.get url soup bea...

(一)BeautifulSoup的安裝

確保必要的工作 已經安裝好python和pip 執行cmd,在命令列中輸入一下命令即可安裝成功。pip install beautifulsoup4 由於本人使用的是ubuntu,即主要講解的是ubuntu下的安裝,其實其他發行版本的安裝都是差不多的。安裝python 由於在ubuntu的發行版本中...