計算單詞出現頻率

2021-09-02 10:49:30 字數 351 閱讀 4278

cat words.txt |tr -cs "[a-z][a-z]" "[\012*]"|tr a-z a-z|sort|uniq -c|sort -k1nr -k2|head -10

但是有時我們想查詢出某乙個單詞的出現頻率這時我們可以使用如下幾個命令

檔名稱:file 查詢單詞名稱:word

操作命令:

(1)more file | grep -o word | wc -l

(2)cat file | grep -o word | wc -l

(3) grep -o test word | wc -l

如果這些還是不能滿足需求,那只能寫linux指令碼進行實現了。可以使用awk哦

統計單詞出現頻率

這裡有乙個大文字,檔案請從 獲取,在解壓後大約有20m 實際比賽時檔案是1.1g 文字中都是英文單詞,空格以及英文的標點符號 句號,逗號,分號,破折號,波浪號,雙引號,問號,單引號,感嘆號 請統計出該文字中最常出現的前10個單詞 不區分大小寫 請注意,在統計中這20個單詞請忽略 the,and,i,...

統計單詞出現的頻率

平時我們在工作的時候需要統計一篇文章或者網頁出現頻率最高的單詞,或者需要統計單詞出現頻率排序。那麼如何完成這個任務了?例如,我們輸入的語句是 hello there this is a test.hello there this was a test,but now it is not.希望得到的公...

python 計算文字中每個單詞的出現頻率

計算文字中每個單詞的使用頻率,並從高到低進行排序 from string import punctuation 開啟資料匯入 text open text.txt def count text dic dict 建立新字典 for line in text word line.split 將字串分割...