python統計txt檔案中的單詞個數

2021-10-25 13:49:25 字數 1186 閱讀 2965

with

open

('統計單詞個數.txt'

,'r'

,encoding=

'utf-8'

)as f:

new_lines=

'' all_the_lines=f.readlines(

)for every_line in all_the_lines:

for i in

range(0

,len

(every_line)):

iford

(every_line[i]

)<

65or

ord(every_line[i]

)>

122:

new_lines=new_lines+

' 'else

: new_lines=new_lines+every_line[i]

new_lines=new_lines.lower(

) words=new_lines.split(

" ")

'''倒序迴圈,從最後乙個元素迴圈到第乙個元素。

不能用正序迴圈,因為正序迴圈刪除元素後,

後續的列表的長度和元素下標同時也跟著變了'''

for i in

range

(len

(words)-1

,-1,

-1):

if words[i]

==''

: words.pop(i)

dic=

for j in words:

if j in dic:

dic[j]+=1

else

: dic[j]=1

list1=

list

(dic.items())

list1.sort(key=

lambda x:

(x[1

],x[0]

),reverse=

true

)for k in

range(0

,len

(list1)):

if k<20:

print

(list1[k]

)

Python 合併多個TXT檔案並統計詞頻的實現

邏輯很清晰簡單,不算難,使用 python 讀取多個 txt 檔案,將檔案的內容寫入新的 txt 中,然後對新 txt 檔案進行詞頻統計,得到最終結果。程式設計客棧 如下 在windows 10,python 3.7.4環境下執行通過 coding utf 8 import re import os...

python讀取txt檔案中的資料

讀取txt檔案中的某一列 int l.split 0 for l in open a.txt 但是讀不了最後一列,出現 indexerror list index out of range的問題。參考 講的很詳細,對於這樣的問題 每行有3列,依次讀取,空格間隔,分別將每行的不同列存到不同的陣列a,b...

python提取txt檔案中的資料

從儲存在txt檔案中的30000多條資料當中提取自己需要的資訊,如下圖示例的資料格式,需要提取出now後的數值並儲存在另外乙個txt檔案當中。結果示例 r as f 開啟檔案 data f.read 讀取檔案 path w r c now 1.txt with open path w,w as f ...