練習0006 最重要詞頻

2021-08-14 20:55:59 字數 1329 閱讀 2472

詳細題目在上。此次是0006題,統計出乙個資料夾下每個文字檔案最為重要的詞。

總的思路是讀取檔案目錄,將所有檔案加至列表中,然後對列表每個檔案中的文字進行過濾,使用字典計算詞出現次數,然後對字典排序,將出現次數最多的詞存到乙個列表中,最後輸出該列表。

# -*- coding: utf-8 -*-

import os

import re

#將資料夾中的檔案放入乙個列表中,如果是子資料夾則忽略。

def getfile(directory):

list = os.listdir(directory)

filelist =

for item in list:

filepath = os.path.join(directory,item)

if not os.path.isdir(filepath):

return filelist

#對於列表中的每個txt檔案,都讀取檔案內容

#然後使用正規表示式過濾除了英文本母外所有字元,然後將其切割為乙個英文單詞列表

#接著將單詞變為小寫,使用字典來計算單詞出現次數

#最後將字典按大到小排序,然後取字典中的第乙個英文單詞,加入到乙個列表中,最後返回該列表

def calculator(filelist):

importantword =

for temp in filelist:

with open(temp, 'r') as file:

word = re.sub(r'[^a-za-z]',' ',unicode(file.read().split()))

word = word.split()

word_dict = {}

for item in word:

item = item.lower()

if not item in word_dict:

word_dict[item] = 1

else :

word_dict[item] += 1

word_dict = sorted(word_dict.iteritems(),key=lambda d:d[1],reverse=true)

theword, value = word_dict[0]

return importantword

#列印每個文字檔案最重要的詞

list = getfile('txt')

calculator(list)

for item in calculator(list):

print item

健康最重要

上午去華油開了兩個多小時的會,等會議結束,已經十二點半了。打車回公司,匆匆吃了碗小牛,辣了吧唧的幾口就沒食慾了。回到公司,見到了同事,同時得知一條不好的訊息 同事的老爸得病了,要做骨頭移植的手術。聽了心裡挺難受的,不知道說什麼安慰的話。同事跟我做乙個專案,為人實在,超級能喝酒,只要我在公司,就我們哥...

人生什麼最重要

人生什麼最重要 在 再努力也燒不開一壺水,說明環境很重要。騎自行車,再努力也追不上寶馬,說明平台很重要。男人,再優秀,沒女人也生不下孩子,說明合作很重要。乙個人,再有能力,也幹不過一群人,說明團隊很重要。想有保障,買再大的水桶都不如挖一口井,說明管道很重要。想要五福臨門,唯有相信因果,注重德修,厚德...

最重要的小事

最重要的小事 作詞 阿信 作曲 瑪莎 我 走過動盪日子 追過夢的放肆 穿過多少生死 卻 假裝若無其事 穿過半個城市 只想看你樣子 這一刻 最重要的事 是屬於你 最小的事 世界紛紛擾擾喧喧鬧鬧 什麼是真實 為你跌跌撞撞傻傻笑笑 買一杯果汁 就算庸庸碌碌匆匆忙忙 活過一輩子 也要分分秒秒年年日日 全心守...