自學爬蟲 day2

2021-10-02 10:20:59 字數 642 閱讀 2080

我們匯入了 web 驅動模組

from selenium import webdriver

無形的瀏覽器phantomjs

將 python 物件轉化為 json是這樣的

json.dumps()

將json資料轉化為python物件是這樣的

json.loads()

python從未縮排的非函式非類的**開始執行

時間print("%s"%(time.strftime("%y-%m-%d %h:%m:%s",time.localtime())))

time.strftime() 接收電腦時間,以字串形式返回電腦的當前時間,返回的格式由引數控制。

將程式短暫的停頓一下,這個時候就需要用到time包下面的sleep函式

class a(b):

pass 表示的是a繼承b,如果a沒有繼承,就不需要寫

.format方法的基本語法是通過 {} 和 : 來代替以前的 % 。

前面的{}叫做槽

find_all(『a』)[-2]就是返回倒數第二個數

os.mkdir(title)建立目錄

referer,告訴伺服器該網頁是從哪個頁面鏈結過來的

在最後,分享小帥b的一句話:高效的自學=自學能力+源動力+耐心+總結

爬蟲學習Day2

import requests if name main url city input enter a city data headers response requests.post url url,data data,headers headers page text response.text...

Python自學筆記 Day2

python3 中有六個標準的資料型別 python3 的六個標準資料型別中 python3 支援int float bool complex 複數 在python 3裡,只有一種整數型別 int,表示為長整型,沒有 python2 中的 long。像大多數語言一樣,數值型別的賦值和計算都是很直觀的...

day2 爬蟲實現登入

import requests 爬登入後的頁面第一種方法 登入之後獲取cookie進行登入 獲取登入後的url url 設定響應頭,獲取登入的cookie headers reponse requests.get url url,headers headers print reponse.text ...