爬蟲日記 html的遍歷

2022-03-11 10:12:39 字數 1319 閱讀 8344

來手打栗子,依然是用上一節的demo

contents列印出了所有子標籤,存在列表裡展示

也可以通過索引取值。

html已經是html的最高端標籤了,沒有父標籤,所以他的父標籤就是它本身。

因為 soup的父節點沒有,所以返回了乙個空

這裡拿出了乙個parents,注意不是parent,所以這裡是以上所有的父標籤,放入乙個列表之中,就可以迭代了,他就會每次都輸出乙個父標籤的名字了。

需要注意的是,平行遍歷只發生在同乙個父親節點之下,若是另乙個節點之下的標籤,是不算他的平行節點的。

最後乙個列印結果為none,因為他的上上個已經沒有平行節點了,所以為空。

這個平行遍歷就不多講了。就是這樣實現的,和遍歷父節點是乙個原理。

爬蟲學習日記

由於之前沒有python基礎,能不能跟上還是很慌的,但還是得盡力 1.檢視網頁robots協議,了解爬取需要遵守的規則 2.使用url re bs4 對單一靜態或動態的介面資訊進行爬取 3.安裝scrapy 爬取 介面部分資訊 獲取書包搜尋介面的商品名稱和 import requests impor...

python 爬蟲日記

首先是三大問題,跟搞哲學的差不多 爬蟲是什麼 爬蟲能做什麼 怎麼學爬蟲 既然是學習,就要做好付出時間和精力在這上面的思想準備 如果是新手,更應該知道接觸新的知識可能會產生挫敗感!沒有一路坎坷,哪有累累碩果!言歸正傳,學習爬蟲技術,就需要知道他涉及的知識點,再根據自己的實際情況,劃重點,攻克難點,總結...

html學習日記

設定背景 background style background url 路徑 分割線字型大小 font size 字型顏色 color 如 style color green margin left 到左邊界距離 margin top 到上邊界距離 margin right 到右邊界距離 marg...