利用python定位網頁上的元素

2022-08-19 20:00:11 字數 1588 閱讀 5077

1. 想對網頁上的元素進行操作,首先需要定位到元素。

# coding = gbk

from selenium import webdriver

chrome_driver_path = "c:\python27\selenium\webdriver\chromedriver\chromedriver"

global browser

browser = webdriver.chrome(chrome_driver_path)

url_int = ""

browser.get(url_int)

通過id定位:

browser.find_element_by_id("kw")

通過name定位:

browser.find_element_by_name("wd")

通過標籤名tag_name定位:

browser.find_element_by_tag_name("input")

通過class_name定位:

browser.find_element_by_class_name("bg_s_btn_wr")

通過css定位:

以id定位:

browser.find_element_by_css_selector("a[id=\"kw\"]")

以name定位:

browser.find_element_by_css_selector("a[name=\"wd\"]")

通過xpath定位:(xpath是一種在xml文件中定位元素的語言)

attribute屬性定位(定位input標籤下,id=kw的元素):

browser.find_element_by_xpath("//input[@id='kw']")
browser.find_element_by_xpath("//div[@id='fm']/form/span/input")

id為check的tr,定位它的第2個td:

browser.find_element_by_xpath("tr[@id='check']/td[2]")

position位置定位(第7個tr裡面的第2個td):

browser.find_element_by_xpath("//tr[7]/td[2]")
browser.find_element_by_xpath("//a[contains(text(),'網頁')]")
browser.find_element_by_xpath("//a[@href='']")
browser.find_element_by_link_text("貼吧")

browser.find_element_by_partial_link_text("貼")

通過class_name定位:

browser.find_element_by_class_name("bg_s_btn_wr")

利用Python抓取和解析網頁 上

對搜尋引擎 檔案索引 文件轉換 資料檢索 站點備份或遷移等應用程式來說,經常用到對網頁 即html檔案 的解析處理。事實上,通過python語言提供的各種模組,我們無需借助web伺服器 或 者web瀏覽器就能夠解析和處理html文件。本文將詳細介紹如何利用python抓取和解析網頁。首先,我們介紹乙...

python網頁資訊 利用python處理網頁資訊

在前幾周的grep sed awk實戰中提到,和coresite any2 california接入商建立網路bgp鄰居關係。從peeringdb上找到了所有接入商的資訊,但是轉移資訊到本地不是很方便,需要進行多次文字調整,耗時較長。作為萌新,立馬就想到近期學習的grep sed awk工具。於是就...

網頁中的定位

1.1.1 網頁中的定位型別 a 靜態定位 static 是預設定位 b 相對定位 relative c 絕對定位 absolute d 固定定位 fixed 瀏覽器對該定位存在相容性問題 e 參照物 1.1.2 相對定位 position relative top 20px 參照頂部發生位置偏移2...