任選乙個英文文字,如何統計其中單詞出現的個數

2021-10-07 15:00:23 字數 1076 閱讀 5229

思路:首先要讀取英文文字.txt,然後對讀取文字進行「空格化」,方便單個單詞的識別,最後將資料寫入新文字中。

**如下

import collections

with open

('test.txt'

,'r'

,encoding=

'utf-8'

) as f:

string=f.

read()

.split

(' '

)text = collections.

counter

(string)

with open

('result.txt'

,'w'

) as r:

for key,value in text.

items()

: r.

write

(key+

':'+

str(value)

+'\n'

)

執行

然後可以在相應的python當前執行程式資料夾中找到生成文字,我的是e盤。

成功

ps:要注意的是encoding=『utf-8』是不能省略的,不然會出現gkb的warning,即如下錯誤:

統計乙個英文文字的單詞出現的頻率(有標點符號的)

該程式為單詞頻率統計,可讀取乙個英文文字檔案 含標點符號 可在螢幕上輸出個單詞在英文文字中出現的次數。詞頻統計 汪強 include include include define i 1000 int b struct word s i void file1 讀出檔案內的單詞 while feof ...

任乙個英文的純文字檔案,統計其中的單詞出現的個數

import re with open a.txt r as f total f.readlines 讀取文字檔案的每一行 s 用於儲存單詞以及單詞的個數 for line in total 對每一行進行單詞識別 a re.findall r a z a z line 具體參考re模組的使用 for...

統計乙個文字的字元 單詞數

文字操作是最常見的,以例子的形式來驅動程式的編寫 encoding utf 8 import time keep defnormalize s 大寫轉換成小寫,並且剔除數字等開頭或不在列表中的字元,返回正常字串 result for c in s.lower if c in keep result ...