任乙個英文的純文字檔案,統計其中的單詞出現的個數

2021-10-07 16:44:46 字數 543 閱讀 1247

import re

with open('a.txt', 'r') as f:

total = f.readlines() # 讀取文字檔案的每一行**

s = {} # 用於儲存單詞以及單詞的個數

for line in total: # 對每一行進行單詞識別

a = re.findall(r'[^a-z\'a-z$]+', line) # 具體參考re模組的使用

for i in a:

line = line.replace(i, ' ') # 將其他字元以空格代替,例如標點符號

print(line) # 列印沒有標點符號的文字檔案的每一行

for word in line.split(): # 將單詞儲存於dict中

if word not in s:

s[word] = 1

else:

s[word] += 1

for k, v in s.items(): # 列印單詞出現的個數

print(k, v)

從html頁面獲取純文字檔案替換其中的內容

通過nsstring裡面的 stringwithcontentsofurl來實現 通過nsstring獲取網頁的源 nsstring webstring nsstringstringwithcontentsofurl nsurlurlwithstring encoding nsutf8stringe...

非純文字檔案的操作

檔案是以某一種標準編碼成二進位制存在硬碟裡的,在應用程式給作業系統傳送資料請求後,作業系統傳送資料請求後,作業系統在硬碟讀取二進位制編碼,然後返回給應用程式,通過open方法,將編碼解碼成我們看到的字元。讀取純文字檔案 r r w w a a rt rt wt wt at at 讀取非純文字檔案 r...

修改乙個文字檔案的方法

目前作個專案,需要實現乙個功能,就是要修改乙個文字檔案中的前面幾行的資料,按一般的做法如下 using system using system.collections.generic using system.text using system.io namespace readline tr.cl...