20180918部落格作業

2022-08-31 17:33:18 字數 4130 閱讀 2067

作業要求參見

本次作業**位址

:**為wf.py檔案

1.根據ascii碼表來去掉特殊字元,比如,。!「」等

定義詞頻字典

迴圈判定每個單詞的頻率

根據字典的value每個單詞詞頻排序

def

getfrequency(testtext):

testtext = re.sub('

[^a-za-z0-9n]

', '

', testtext) #

根據ascii碼表去掉特殊字元,比如,。!「」等

frequency = {} #

定義詞頻字典

for word in testtext.split(): #

迴圈判定每個單詞頻率

if word in

frequency:

frequency[word] += 1

else

: frequency[word] = 1frequency = sorted(frequency.items(),key = lambda x:x[1],reverse = true)

2.全文共有___個不重複的單詞,以及每個單詞出現的次數

根據文字的詞彙量總數來判定顯示多少個資料

print('

全文共有

',len(frequency),'

個不重複的單詞')

if (len(frequency) > 100):

for x in range(0,10):

a =frequency[x][0]

b = frequency[x][1]

print('

單詞',a,'

出現的次數為

',b)

else

:

for x in

range(0,len(frequency)):

a =frequency[x][0]

b = frequency[x][1]

print('

單詞',a,'

出現的次數為

',b)

3.輸出單一文字

def

inputfc(inputtxt):

with open(inputtxt,encoding = '

utf-8

') as wf:

getfrequency(wf.read())

4.輸入資料夾統計資料夾內文字函式

def

inputfilefc(self):

name_delete = '

([\s\s]*?).txt

'txtlist =

txtlist =os.listdir(inputfile)

for i in

range(0,len(txtlist)):

a =re.findall(name_delete, txtlist[i])

print

(a) inputfc(txtlist[i])

功能實現測試文字,無重難點

迴圈判定每個單詞頻率

if word in

frequency:

frequency[word] += 1

else

: frequency[word] = 1frequency = sorted(frequency.items(),key = lambda x:x[1],reverse = true) #

根據字典的value(每個單詞詞頻)排序

print('') #

為了好看

print('

全文共有

',len(frequency),'

個不重複的單詞

')2.重點是檔名後面一定要輸入.txt

def(定義函式)

inputfc

輸入文字到

python

輸入文字位址

inputtxt = input() #

輸入文字位址

inputfc(inputtxt)

def(定義函式)inputfc

輸入文字到

python

def

inputfc(inputtxt):

with open(inputtxt,encoding = '

utf-8

') as wf:

getfrequency(wf.read())

3.輸入資料夾,對資料夾內的所有文字進行詞頻統計

重點:匯入文字

def inputfilefc(self)

txtlist = os.listdir(inputfile)匯入資料夾

def

inputfilefc(self):

name_delete = '

([\s\s]*?).txt

'txtlist =

txtlist =os.listdir(inputfile)

for i in

range(0,len(txtlist)):

a =re.findall(name_delete, txtlist[i])

print

(a) inputfc(txtlist[i])

統計結果

4.重點:command = input()鍵盤輸入指令

將資料匯入csv文件中

command = 1

while

command:

print("

輸入1匯入文件,輸入其他退出程式,回車鍵確認!")

command =input()

if command == '1'

:

print("

請輸入匯入的文件位址,回車鍵確認!")

inputcommand =input()

with open(inputcommand,encoding = '

utf-8

') as wf:

outtxt =wf.read()

with open(

"1.csv

","w

", newline=''

) as csvfile:

writer =csv.writer(csvfile)

writer.writerow(["單詞

","詞頻"])

outtxt = re.sub('

[^a-za-z0-9n]

', '

', outtxt) #

根據ascii碼表去掉特殊字元,比如,。!「」等

frequency = {} #

定義詞頻字典

psp階段

部落格作業10

這個作業屬於哪個課程 c語言程式設計ll 這個作業的要求 我在這個課程的目標是 熟練掌握迴圈結構以及巢狀迴圈 這個作業在哪個具體方面幫我實現了目標 pta的練習作業以及課外自查詢的資料及教材 參考文獻 題目內容描述 本題要求編寫程式,輸出n行由大寫字母a開始構成的三角形字元陣列。資料表達 本題我運用...

部落格作業07

這個作業屬於哪個課程 c語言程式設計ll 這個作業的要求在 這個課程的目標 熟練掌握switch語句 這個課程在哪個具體方面幫我實現了目標 pta的作業 參考文獻 c語言程式設計教材及其資料書 題目內容描述 自從湖南農業大學 吉首大學和懷化學院組織程式設計課程聯考以後,舉辦聯考的經驗越來豐富。尤其是...

部落格作業09

這個作業屬於那個課程 c語言程式設計ii 這個作業要求在 我在這個課程的目標是 熟練的掌握每一門我想學習的程式語言 這個作業在那個具體方面幫助我實現目標 提高了我對c語言的一些理解,讓我對c語言更加熟悉 參考文獻 pta常見問題解答 提問的智慧型 1 1 1 1 2 2 2 2 4 1 3 3 2 ...