cuckoo提取樣本字串

2021-10-02 08:43:23 字數 701 閱讀 4001

**位置:cuckoo\\processing\\strings.py

#coding:utf-8

import re

data=open("filepath","rb").read() # 一定要以二進位制形式讀取檔案的全部內容,否則你會發現匹配出來的字串不全

strings_a = re.findall("[ -~]",data) # 讀取1個以上的單位元組連續可顯示字元(0x20-0x7e)

strings_w = re.findall("(?:[ -~]\x00)",data): # 讀取1個以上的unicode編碼的連續可顯示字元

return strings_a,strings_w

大概就是以二進位制形式讀取檔案之後,使用正規表示式做匹配。

其中(?:[ -~]\x00)應該是把2個位元組作為乙個基本單位進行匹配,

若是(?:[ -~]\x00\x00)應該是把3個位元組作為乙個基本單位進行匹配。

注意在ida的字串視窗中看到\t、\n也顯示在字串中,可以在正規表示式的[ ]中加入\t、\n,如下:

[ -~\\t\\n] 或者 [ -~\x09\x0a]

對於中文語系,可以使用專門匹配漢字的正規表示式

基本字串壓縮

利用字元重複出現的次數,編寫乙個方法,實現基本的字串壓縮功能。比如,字串 aabcccccaaa 經壓縮會變成 a2b1c5a3 若壓縮後的字串沒有變短,則返回原先的字串。給定乙個string inistring為待壓縮的串 長度小於等於3000 保證串內字元均由大小寫英文本母組成,返回乙個stri...

基本字串壓縮

利用字元重複出現的次數,編寫乙個方法,實現基本的字串壓縮功能。比如,字串 aabcccccaaa 經壓縮會變成 a2b1c5a3 若壓縮後的字串沒有變短,則返回原先的字串。給定乙個string inistring為待壓縮的串 長度小於等於3000 保證串內字元均由大小寫英文本母組成,返回乙個stri...

基本字串壓縮

題目 利用字元重複出現的次數,編寫乙個方法,實現基本的字串壓縮功能。比如,字串 aabcccccaaa 經壓縮會變成 a2b1c5a3 若壓縮後的字串沒有變短,則返回原先的字串。給定乙個string inistring為待壓縮的串 長度小於等於3000 保證串內字元均由大小寫英文本母組成,返回乙個s...