python 統計文章單詞個數

2021-08-11 11:41:26 字數 728 閱讀 4607

**

def gettext():

txt=open("article.txt","r").read()

txt=txt.lower()

for ch in

'~!@#$%^&*()_+"{}|?.<>?':

txt=txt.replace(ch,"")

return txt

hamlettxt=gettext()

words=hamlettxt.split()

counts={}

forword

inwords:

counts[word]=counts.get(word,0)+1

items=list(counts.items())

items.sort(key=lambda x:x[1],reverse=true)

for i in range (10): ###這裡就讓它輸出10個看看得了

word,count=items[i]

print("".format(word,count))

此**有效的前提是你建立了乙個article.txt。在裡面寫上你要統計的單詞。

(一定要將py和文章放在同乙個地方)比如都放在桌面

執行效果如下

python統計文章單詞次數

題目是這樣的 你有乙個目錄,放了你乙個月的日記,都是 txt,為了避免分詞的問題,假設內容都是英文,請統計出你認為每篇日記最重要的詞。其實就是統計一篇文章出現最多的單詞,但是要去除那些常見的連詞 介詞和謂語動詞等,coding utf 8 import collections import re i...

統計單詞個數

輸入 檔名稱 sum123.cpp 作 者 林海雲 完成日期 2014年12月16日 版 本 號 v2.0 問題描述 統計各陣列中單詞的個數 程式輸入 程式輸出 統計結果 include includeusing namespace std int pwordnum char str int mai...

統計單詞個數

qaq 話說這個題目跟那個乘號的比較像啊,用f i j 表示前i個字母劃分為j段的單詞最大數 那麼我們很容易就得到乙個狀態轉移方程 f i j max f i j f l 1 j w w為l i區間裡單詞的數目 現在的問題是w咋求 之前我做的乙個題是劃分乘號的 那個我們處理了乙個sum i j 陣列...