爬蟲第二步 解析資料(1)

2021-10-11 13:45:29 字數 1485 閱讀 1273

html是用來描述網頁構成的一種語言,

全稱為:hyper text markup language,

也叫做超文字標記語言

標記語言內容主要包括:文字及格式(大小、顏色、位置)

右擊網頁【檢視源**】或按ctrl+u可以檢視當前網頁的原始碼

由於使用爬蟲訪問資源,需要我們替代瀏覽器來解析網頁內容,因此能夠讀懂和簡單修改網頁編寫的常用語言html是必要的技能。

這裡介紹乙個html自學**:

html一般由三部分所構成:標籤、元素、屬性,同時html語言和python一樣是有縮排的,用於表現**之間的層級關係。

標籤會成對出現,都帶有尖括號<> 和 ,分別代表著該元素的開始和結束,標籤中間的內容則是元素。常用標籤如下:

標籤作用

< html>

定義html文件

< head>

定義文件頭部

< body>

定義文件主體

< a>

定義超連結

< audio>

定義音訊

< button>

定義按鈕

< div>

定義塊區域

< h1> ,< h2>

定義標題

< p>

定義段落

< img>

定義< ol>

定義有序列表

< ul>

定義無序列表

< li>

定義單個列表條目

元素是指網頁展現的主體內容,即從開始標籤到結束標籤內的所有內容

>

charset

="utf-8"

>

>

/*規定h1的具體樣式*/

h3style

>

head

>

>

>

h1格式的內容h3

>

body

>

>

charset

="utf-8"

>

>

/*定義class屬性為style1的格式*/

.style1

/*定義class屬性為style2的格式*/

.style2

style

>

head

>

>

class

='style1'

src='***xx.png'

>

class

='style2'

src='***xx.png'

>

body

>

id 屬性:整個文件獨一無二的標識

在< style>標籤中定義class屬性的樣式用點 .,id屬性用井號鍵#

js第二步學習1

今天學習的乙個例子是 首先是4個運算方法 function add x,y function subtract x,y function multip x,y function division x,y 寫乙個公用方法可以呼叫上面4個方法 function pro operate,operand1,...

diango專案第二步

django 模板 使用 django.http.httpresponse 來輸出 hello world!該方式將資料與檢視混合在一起,不符合 django 的 mvc 思想。django 的模板是乙個文字,用於分離文件的表現形式和內容。模板應用例項,在 helloworld 目錄底下建立 tem...

python學習第二步

函式的呼叫 以絕對值函式abs 為例,可以直接從python的官方 檢視文件,也可以從互動介面利用help abs 檢視。常用或不好記函式 持續更新 hex 函式 將乙個整數轉換為十六進製制表示的字串。函式的定義 定義乙個函式要使用def語句,函式返回值用return語句返回。ep def my a...