python3呼叫Chrome進行簡單文字爬蟲

2021-09-24 03:26:46 字數 727 閱讀 9344

import re		#python自帶模組

from selenium import webdriver #selenium模組需自行安裝

driver=webdriver.chrome() #呼叫谷歌瀏覽器驅動

url=「

driver,get(url)

pagesource=driver.page_source #獲取url資料

#定義正規表示式提取可用文字

restr1="class=\"xlistju\">[^\x00-\xff]"

regex1=re.compile(restr1,re.ignorecase)

mylist1=regex1.findall(pahesource)

mystr1="\n".join(mylist1)#列表轉化為字串

restr2="[^\x00-\xff0-9]+"#正規表示式第二次篩選

regex2=re.compile(restr2,re.ignorecase)

mylist2=regex2.findall(mystr1)

mystr2="\n".join(mylist2)

#將提取出來的資訊寫入檔案

infile=open("g:/notepad.txt","w+",encoding="utf-8"

infile.write(mystr2)

infile.close()

日常Python 3 呼叫函式

任務.輸出每日一貼 在idle中建立乙個名為function tips.py的檔案,然後在該檔案中建立乙個名稱為function tips的函式,在該函式中,從勵志文字列表中獲取一條勵志文字並輸出,最後再呼叫函式function tips 如下 coding gbk def function tip...

python3呼叫http介面

最近在寫python呼叫介面的服務,寫了乙個呼叫介面的函式,如下 param inputdata 單個樣本的輸入引數,是json格式的資料 return 單個樣本的探真查詢變數結果資料 呼叫介面 介面有正確的資料才讀入,否則為空 if res code 0000 res data json.load...

Python3呼叫Google翻譯

import urllib.request from handlejs import py4js def open url url headers req urllib.request.request url url,headers headers response urllib.request.u...