wireshark中篩選中文內容

2021-09-27 06:49:26 字數 756 閱讀 4802

工作需要經常需要在wireshark裡搜尋內容,記錄一點小tips

搜尋方式是直接使用tcp.payload contains 「***」,或者data.data contains 「***」

由於 不同請求傳送方處理的方式不同,需要多處理集中情況

1,傳送方進行了urlencode,搜尋的就是內容.encode的內容

2,如果傳送方是進行的gbk編碼,直接使用tcp.payload contains "中文"在wireshark裡是可以搜尋到的,應該是wireshark模式也使用的gbk,乙個中文在十六進製制檢視裡占用了兩位。

3,如果傳送方使用的是utf8編碼,乙個漢字可能佔據了三位,直接在wireshark裡搜尋不到,還需要手動轉換一下。

具體差別,可以寫一段python,直接抓包檢視差距

import socket

host = 『172.16.129.6』

dstport = 34567

target = (host,dstport)

try:

s = socket.socket(socket.af_inet,socket.sock_stream)

except:

print 「error!」

s.connect(target)

#下面一行切換gbk和utf8編碼檢視抓包,傳送內容不一樣,wireshark搜尋不到utf8編碼的

s.send(bytes(「你」))

#s.send(bytes(quote(「你」)))

wireshark 篩選HTTP流量

1 讓wireshark只顯示訪問某指定網域名稱 www.bt2bn.cn 的http請求資料報 http.host www.bt2bn.cn 2 讓wireshark只顯示訪問包含了指定字串的網域名稱 比如,包含bt2bn的網域名稱 的http請求資料報 http.host contains bt...

Excel 篩選中文字

大家都知道,中文字元最大的特點就是雙位元組,在excel中同樣如此,因此可以使用公式來區分開中文字元。假設資料在a列。在b1中輸入公式 left a1,lenb a1 len a1 公式往下拉 則可快速得到中文的單元格。其中,excel中,len 函式是返回字元個數,而lenb 函式是返回位元組數,...

python篩選中日韓文

通常我們可以使用 repr 函式檢視字串的原始格式。這對於寫正規表示式有所幫助。utf 8 是變長的,1 6個位元組,少數是漢字每個占用3個位元組,多數占用4個位元組,正則式為 x80 xff re.match re.search 兩個函式的匹配過程完全一致,只是起點不同。match只從字串的開始位...