使用sed過濾提取文字中的資訊

2021-07-11 20:57:47 字數 419 閱讀 4377

sed -r -n -e '/error/p' mntenu_check.log | sed -r -e '/\[.\.mlf\]/!d' | sed -r -e 's/.*\[(.)\.mlf\].*/\1/g' | uniq > filenamestoberemoved.log

note:顯示的不正確,請用plain text來看和拷貝。

1. 第一步,在檔案中將含有"error"字串的行輸出。-n 與p的配合使用

2. 第二步,僅輸出含有[******xx.mlf]的行。

3. 第三步,提取出******xx的資訊,用的是s,g配合的替換操作

4. 第四步,使用uniq命令輸出去重後的******xx。注意,使用uniq之前要先排序,我這裡第三步的輸出必然是排好序的,所以就不用專門排序了。

使用sklearn提取文字的tfidf特徵

from sklearn.feature extraction.text import countvectorizer,tfidfvectorizer,tfidftransformercorpus this is the first document.this is the second secon...

shell指令碼中sed的使用

sed語法格式 語法格式 sed 選項 編輯指令 檔名 選項 n 遮蔽預設輸出 i 直接修改檔案內容 r 啟用擴充套件正則 條件 1.行號 指令 p 輸出 print 例子 列印第一到四行 sed n 1,4p passwd 列印第三行,第五行 sed n 3p 5p passwd 列印第三行之後的...

使用 awk 過濾文字或檔案中的字串

當我們在 unix linux 下使用特定的命令從字串或檔案中讀取或編輯文字時,我們經常需要過濾輸出以得到感興趣的部分。這時正規表示式就派上用場了。什麼是正規表示式?正規表示式可以定義為代表若干個字串行的字串。它最重要的功能之一就是它允許你過濾一條命令或乙個檔案的輸出 編輯文字或配置檔案的一部分等等...