selenium 獲取網頁原始碼

2021-07-31 22:19:07 字數 1034 閱讀 7269

selenium

本是用來對

做自動化測試的。不過,它有個天大的好處:能讓我們用

python

(當然不僅是

python

)**模擬人對瀏覽器的操作。

所需軟體:

python2.7

,firefox

25.0.1

(版本不能太高),

selenium2

.44.0

(使用pip install selenium

安裝即可)1.5

秒鐘後關閉瀏覽器

from

selenium

import

webdriver

import

time

brower

=webdriver

.firefox

()brower

.get

('')time

.sleep(5

)brower

.close

()注意

url的寫法,前面必須加

開啟瀏覽器,請求乙個帶有動態內容的網頁,等待

js執行完畢(

10秒鐘足夠),獲取當前瀏覽器

render

的內容的原始碼,關閉瀏覽器

from

selenium

import

webdriver

import

time

browser

=webdriver

.firefox

()browser

.get

(' '

)time

.sleep(10

)pagesource

=browser

.page_source

print

pagesource

browser

.close

()

獲取網頁原始碼

c 獲取指定網頁html原 可使用 webclient webrequest httpwebrequest 三種方式來實現。當然也可使用webbrowse!在此就不研究webbrowse如何獲取了。注意 utf 8 應與指定網頁的編碼對應。可以看到httpwebrequest 方式最複雜,但確提供了...

c 獲取網頁原始碼

c 獲取指定網頁html原 可使用 webclient webrequest httpwebrequest 三種方式來實現。當然也可使用webbrowse!在此就不研究webbrowse如何獲取了。注意 utf 8 應與指定網頁的編碼對應。可以看到httpwebrequest 方式最複雜,但確提供了...

如何獲取網頁原始碼

獲取網頁原始碼可以通過webrequest類和webresponse類。1.webrequest類 webrequest類是.net framework的請求 響應模型的abstract基類,用於訪問internet資料。使用請求 響應模型的應用程式可以用協議不可知的方式從internet請求資料。...