Python3 爬蟲學習筆記 變數與資料型別 2

2021-08-30 02:03:59 字數 1849 閱讀 3073

資料型別的轉換

變數的資料型別非常重要,通常情況下只有相同型別的變數才能進行運算。python提供了簡單的資料型別自動轉換功能:如果是整數與符號運算,系統會先將整數轉換為浮點數再運算,運算結果為浮點型,例如:

num1 =5+

7.8# 結果為12.8,浮點型

若是數值與布林值運算,系統先將布林值轉換為數值再運算,即把true轉換為1,false轉換為0。例如:

num2 =5+

true

# 結果為6,整型

如果系統無法自動進行資料型別轉換,就要用資料型別轉換命令進行強制轉換。python的強制資料型別轉換命令有:

例如,整數與字串直接相加時會產生錯誤:

num3 =23+

"67"

# 錯誤,字串無法進行加法運算

那麼,我們可先把字串轉換為整數再進行運算,這樣就可以正常執行:

num3 =23+

int(

"67"

)# 正確,結果為90

再比如,用print列印字串時,若把字串和數值相加會產生錯誤:

scroe =

60print

("小明的成績為"

+ score)

# 錯誤,數值無法自動轉換為字串

把數值轉換為字串再進行相加即可正常執行:

scroe =

60print

("小明的成績為"

+str

(score)

)# 正確,結果為「小明的成績為60」

list(列表)結構

列表與其他語言的「陣列(array)」相同,用於生成儲存資料的記憶體空間。每個列表有乙個名稱,作為識別該列表的標識,稱為列表變數;列表中每乙個資料稱為「元素」,列表中的元素通過列表變數的下標進行訪問。

列表資料結構的格式是把元素放在中括號中,元素之間以逗號分隔,如下:

列表名稱 =

[元素1, 元素2,.

....

.]

通過列表變數的下標值,可以訪問列表元素的值。下標值用方括號括起,從0開始計數。下標值也可以是負值,表示由列表的最後向前取值,「-1」表示最後乙個元素。

range()函式

元素為有序整數的列表稱為整數有序列表,如「1,2,3,…」,這種列表在迴圈中會經常用到。range()函式的功能就是建立乙個整數有序列表。

包含3個引數的range函式格式為:

列表變數 =

range

(m, n, o)

# m,n,o都是整數,依次表示起始值、終止值、間隔值

元組(tuple)結構

元組結構與列表完全相同,不同之處在於元組的元素個數及元素值都不能改變,而列表則可以改變。

元組的使用方法是把元素放在小括號中(列表是中括號),元素之間以逗號分隔,語法為:

元組名稱 =

(元素1,元素2,...

...)

python中的list命令可將元組轉換為列表,tuple命令可將列表轉換為元組。

字典結構(dict)結構

字典結構中的元素是以「鍵-值」對方式儲存的,我們可以通過「鍵」,來取出其「值」。字典型別是把元素放在一對大括號中,其語法為:

字典名稱 =

由於字典是使用「鍵」作為下標來返回「值」,因此「鍵」必須是唯一的,「值」則可以重複。如果「鍵」重複,則前面的「鍵」無效,只有最後的「鍵」有效。

python3爬蟲學習筆記

爬蟲爬取京東某手機頁面 beautifulsoup 原文記錄內容太多現進行摘錄和分類 pip3 install jieba kou ubuntu python cat clahamlet.py usr bin env python coding utf 8 e10.1calhamlet.py def...

python3爬蟲筆記

請求 並提取 資料的 自動化 程式 發起請求 獲取響應內容 解析文字內容 儲存資料 1.瀏覽器傳送資訊給該 所在的伺服器,這個過程叫做http request。2.服務收到瀏覽器傳送的訊息後,能夠根據瀏覽器傳送訊息的內容,做相應的處理,然後把訊息回傳給瀏覽器。這個過程叫做http response。...

Python3爬蟲學習筆記0 0 綜述

歡迎捧場,博主前一段時間零零碎碎地學習了一些python爬蟲的知識,現在把一些學習內容整理出來,水平有限,難免出現錯誤,希望大家能夠批評指正,謝謝。該系列部落格的內容參照 崔慶才 靜覓的部落格內容完成,謝謝授權。python 版本 3.5 預備知識 python基礎,http協議,正規表示式,url...