Python爬蟲之轉義和反轉義使用方法

2021-10-02 05:19:48 字數 1587 閱讀 2308

在使用爬蟲時經常遇到各種需要轉義的地方,總結了各種轉義的方式分享給大家?

**如下:

# -*- coding:utf-8 -*-

import html

from urllib.parse import urlparse

from urllib.parse import urljoin

from urllib.parse import urlencode, parse_qs, parse_qsl

from urllib.parse import quote, unquote

__author__ =

'evan'

print

('返回乙個parseresult型別的物件: '

, urlparse(

''))

print

('合併兩個字串組合成乙個完整的url: '

, urljoin(

'','index.html'))

params =

print

('將字典序列化為get請求引數: '

,'?'

+ urlencode(params)

)print

('將get請求引數反序列化為字典: '

, parse_qs(

'?name=evan&id=77'))

print

('將get請求引數反序列化為列表: '

, parse_qsl(

'?name=evan&id=77'))

print

('將中文轉化為url編碼: '

,'?'

+ quote(

'年齡'))

print

('將url編碼轉化為中文: '

, unquote(

'?%e5%b9%b4%e9%be%84'))

print

('html格式反轉義成字元: '

, html.unescape(

''))

執行結果:

返回乙個parseresult型別的物件:  parseresult(scheme=

)合併兩個字串組合成乙個完整的url: http:

將字典序列化為get請求引數: http:

77將get請求引數反序列化為字典:

將get請求引數反序列化為列表:[(

'?name'

,'evan'),

('id'

,'77')]

將中文轉化為url編碼: http:

84將url編碼轉化為中文: http:

年齡html格式反轉義成字元: https:

.0.1

/report

轉義和反轉義

簡單說一下業務場景,前台使用者通過 input 輸入內容,在離開焦點時,將內容在 div 中顯示。這時遇到乙個問題,如果使用者輸入了 html 標籤,則在 div 顯示中,標籤被解析。由於是純前端操作,不涉及後端,因此需要通過 js 對輸入內容進行轉義。這裡提供乙個非常簡單有效的轉義方案,利用了 i...

轉義與反轉義

span 內容會作為html 解析,其他資料沒問題,url 就不行了,url 中的 會被解釋成 amp 而上傳到伺服器,用自定義標籤即可 link style display none link document.getelementbyid link value document.geteleme...

字串 轉義 反轉義

本人用wangeditor富文字外掛程式的時候 富文字的內容裡有鏈結 以及各種標籤 想存到資料庫中 出現了 特殊字元 json轉換錯誤 得把字串轉義一下存到後台 靠的就是這幾行 解決的問題 很有用 escapehtml就是把帶有html標籤以及特殊字元給轉義一下 傳給後台 存入資料庫 unescap...