漢字字頻統計程式(Python版)

2021-07-03 13:15:37 字數 760 閱讀 9396

用python寫了乙個漢字詞頻統計程式,針對已經分好詞的文字。

#python 3.4.3

#功能:統計文字中的詞頻。

#缺陷:標點符號的頻數也會計算在內。

with

open('test.txt', mode='r', encoding='utf-8') as infile:

dict={} # 建立乙個空字典

word=''

# 空字串以便於連線字元

forchar

in infile.read():

ifchar != ' ':

word += char

# 連線字元

else:

ifword

in dict:

dict[word]+=1

word=''

# 將word置為空,否則,word值無限增大

else:

dict.setdefault(word, 1)

word=''

with

open('wordfreq.xls', mode='w', encoding='gbk') as outfile:

forword, freq in dict.items():

s = '\t\n'.format(word, freq)

outfile.write(s)

功能並不完善,期待解決。

Python之統計程式執行耗時

思路 程式開始前後各記錄乙個時間點,兩個時間點相減即程式執行耗時時間 方法1 普通計算方法 import time import sys import os start time time.clock time.sleep 5 stop time time.clock cost stop time ...

Python中統計程式執行時間的方法彙總

以下列舉常用統計程式執行時間的方法。import datetime starttime datetime.datetime.now long running do something other endtime datetime.datetime.now print endtime starttim...

Python中統計程式執行時間的方法彙總

以下列舉常用統計程式執行時間的方法。方法1 import datetime starttime datetime.datetime.now long running do something other endtime datetime.datetime.now print endtime star...