爬蟲所需要的HTML基礎

2021-08-25 08:42:49 字數 3272 閱讀 8908

下方是乙個基本的網頁**框架

文件標題title>

head>

文件內容......

body>

html>

乙個網頁的基本示例

headings and paragraphstitle>

head>

this is my first paragraphp>

heading 4h4>

heading 5h5>

heading 6h6>

this is my second paragraphp>

style="background: skyblue">this is a divdiv>

body>

html>最基本的標籤說明

標籤基本格式:《標籤名 屬性名1="屬性值" 屬性名2="屬性值" ...>文件內容: 用於**開頭指定html版本等資訊;

: 告知瀏覽器這是乙個html文件,是html文件中最外層的元素;

: 所有頭部元素的容器,必須包含文件的標題(title),可以包含指令碼、樣式、meta資訊以及其他;

: 定義文件的標題,定義瀏覽器工具欄中的標題,顯示在搜尋引擎結果中的頁面標題;

: 定義文件的主體,包含文件的所有內容(比如文字、超連結、影象、**和列表等);

: 定義html標題,從標題的重要程度逐漸降低;

: 定義段落,瀏覽器會自動在其前後建立一些空白;

: 乙個簡單的換行符,是乙個空標籤,意味著它沒有結束標籤;

:定義html文件中的乙個分隔區塊或者乙個區域部分,經常與css一起使用,用來布局網頁。

鏈結中一些常用的標籤

標籤實現基本的超連結

訪問dc官網

其中

指向同一伺服器同一目錄下的form.html

fill our form

指向同一伺服器父目錄下的parent.html

parent

指向同一伺服器子目錄下的stuff下的cat.html

catalog

指向外部** (會在新的標籤頁開啟)

basd

超連結除了指向乙個檔案,還可以具體指明位置,這樣瀏覽器就會直接跳轉顯示檔案的相應位置。指向同乙個檔案的其他位置

"#section1">go to introduction

...

指向其他檔案的某個位置

href="chapter3.html#section3.1.1>go to section 3.1.1

...section3.1.1">

div>

標籤

插入一張,指向同一伺服器同一目錄下的php.png

其中為標籤;scr="pho.png"表示同一伺服器同一目錄下的php.png這個;alt="php logo"表示的代替文字,如果無法顯示,則顯示這個文字。

標籤的一些基本屬性

src: 路徑

alt: 無法顯示時的代替文字

height: 高度

width: 寬度

border: 邊框寬度

無序列表

無序列表一般用有序列表

有序列表一般用+的形式來表現,乙個簡單的例子

coffeeli>

milkli>

teali>

ol>

顯示如下:

coffee

milk

tea

我們也可以通過規定起始值的形式來編號:

coffee

milk

tea

顯示如下:

coffee

milk

tea

**html**由多種標籤組合而成,其中最重要的三種標籤是

: **的開始和結束

: 建立**的一行

: 建立**中的普通單元格

: 建立**中標題欄單元格

乙個簡單的**示例

first

last name

agejill

smith

50eve

jackson

94john

doe80

1">

firstth>

last nameth>

ageth>

tr>

jilltd>

jacksontd>

94td>

tr>

evetd>

jacksontd>

94td>

tr>

johntd>

doetd>

80td>

tr>

table>

表單用於收集使用者輸入的資訊,乙個簡單的例子如下:

拓展閱讀

http基礎知識

1.http基礎知識對於爬蟲的作用

http–超文字傳輸協議(hypertext transfer protocol)是網際網路中應用最為廣泛的一種網路協議,設計的最初目的就是為了提供一種發布和接受html頁面的方法,而爬蟲的本質就是通過程式發生http請求,並返回html文件,遵守http的傳輸協議是爬蟲的基礎。

2.http報文

http協議中有兩個報文,乙個是請求報文,乙個是相應報文,這是http協議的核心內容

- http訊息結構

HTML 爬蟲所需HTML知識

1 標籤 定義整體的表單區域 2 標籤 為表單元素定義文字標註 3 標籤 定義通用的表單元素 value屬性 定義表單元素的值 name屬性 定義表單元素的名稱,此名稱是提交資料時的鍵名 4 標籤 定義多行文字輸入框 5 標籤 定義下拉表單元素 6 標籤 與標籤配合,定義下拉表單元素中的選項 登錄檔...

ACE程式設計中所需要DOS基礎

ace程式設計中所需要dos基礎 author stone jiang date 2010 08 07 12 59 16 table of contents 1 win32下ace程式設計的dos基礎 1.1 簡介 1.2 進入dos shell 1.3 基本的dos命令 1.3.1 改變當前碟符 ...

vmware所需要的埠

埠 描述 80vcenter server 需要埠 80 用於直接 http 連線。埠 80 會將請求重定向到 https 埠 443。如果意外使用了 http server 而不是 https server,此重定向將非常有用。如果使用與 vcenter server 儲存在同一主機上的自定義mi...