如何使用linux命令統計文字中某個單詞的出現頻率

2021-06-27 17:55:42 字數 386 閱讀 3704

使用這個命令查出文字中的單詞出現頻率按照由高到底排序

cat words.txt |tr -cs "[a-z][a-z]" "[\012*]"|tr a-z a-z|sort|uniq -c|sort -k1nr -k2|head -10

但是有時我們想查詢出某乙個單詞的出現頻率這時我們可以使用如下幾個命令

檔名稱:file  查詢單詞名稱:word

操作命令:

(1)more file | grep -o word | wc -l

(2)cat file | grep -o word | wc -l

(3) grep -o test word | wc -l

如果這些還是不能滿足需求,那只能寫linux指令碼進行實現了。可以使用awk哦

linux統計命令

排序命令 sort 按第一位字元大小去排列,以此類推 n按照數字大小去排列 r反序排列 o filename 排序後的順序輸出到另乙個檔案 t 分割符號 只能用乙個字元分割 eg t k n 按照第n列去排序 eg t k 3 v按照版本方式去排序 uniq 用來去重使用 當前行只會與上下行內容進行...

Linux中文字工具檢視,分析統計文字

抽取文字的工具 檔案檢視一般選擇cat命令,直接在命令框中檢視檔案中內容,不開啟檔案 cat option file e 顯示行結束符 n 對顯示的每一行進行編號 a 顯示所有的空字元 b 對非空字元進行顯示 s 壓縮連續的空行成一行 檢視文字前幾行 head 命令 head option file...

Linux 統計命令wc

如果我想要知道 etc man.config 這個檔案裡面有多少字?多少行?多少字元的話,可以怎麼做呢?其實可以利用 wc 這個命令來達成喔!他可以幫我們計算輸出的資訊的整體資料!root www wc lwm 選項與引數 l 僅列出行 w 僅列出多少字 英文單字 m 多少字元 範例一 那個 etc...