201671010412 郭佳 英文文字統計分析

2022-05-07 02:57:13 字數 3921 閱讀 9939

專案

內容專案名稱

實驗四 英文文字統計分析

github的倉庫主頁

所屬課程

作業要求

實驗四 軟體工程結對專案

課程學習目標

體驗兩人合作,練習結對程式設計;

掌握github上增量發布軟體的操作方法

#任務一:

點評物件 :201671010434王雯涵

點評作業的位址 :

點評內容 :

從我的博文和結對隊友王雯涵的專案對比可以看出,我們對於設計階段的內容都不夠詳細,應該更具體的描述該系統的設計,並且對涉及到的類或方法進行要進行必要說明。在具體編碼中,我的**不夠規範,對於一些型別和方法名起的過於簡單,不能夠直接明了的體現出類或方法的含義,讓人不容易理解,然而王雯涵在這方面做的很好,所以在實驗四中,我會彌補實驗二中的不足,讓**更規範。

#任務二:本次實驗任務是在實驗二個人軟體專案的基礎上實現英文文字的統計分析。

所以本次實驗的需求除了實驗二所提到的還需實現下列需求:

##2. 功能設計

**根據需求分析中提到的內容,本程式中設計以下幾個功能:**

count1類用於對檔案獲取和處理,它裡面主要有三個方法,其中:

wordcountmain類用於處理前台頁面中的使用者請求,它裡面主要有五個方法,其中:

##4.測試執行

1.**啟動tomcat伺服器,在瀏覽器中輸入訪問位址,進入主介面**

![主介面](

3.顯示詞頻總數,統計結果及其消耗時間

4.選擇功能選項2:統計指定單詞詞頻個數

5.選擇功能選項3:查詢k個高頻詞的詞頻及其統計圖

6.選擇功能選項4:統計指定文字中的行數及其消耗時間

7.選擇功能選項5:統計指定檔案中的字元數及其消耗時間

1.統計給定單詞詞頻

}2.統計k個高頻詞出現的次數

}

##6.	總結:

第一次嘗試兩人合作的軟體開發模式,剛開始非常的不適應,在結對程式設計的時候因為兩個人的編碼習慣不同,思維方式也不同,會出現意見不一致,矛盾爭吵等問題,但慢慢的熟悉之後就會發現結對程式設計其實也有好多好處,我覺得最大的好處就是減少了**出錯的概率。乙個人程式設計時總會出現一些細小又不易察覺的錯誤,但兩人結對時,對方就會注意到這些小問題並且及時指出,從而減少了出錯的概率。

下面是我們結對程式設計過程情景:

![結對程式設計過程](

##7.psp個人軟體過程

psp2.1|任務內容|計畫共完成需要的時間(min)|實際完成需要的時間(min)

--|:--|:--:|:--:

planning|計畫|5|6

•estimate |• 估計這個任務需要多少時間,並規劃大致工作步驟|5|6

development|開發|562|591

••analysis|需求分析 (包括學習新技術)|10|15

•design spec|• 生成設計文件 |5|7

•design review|• 設計複審 (和同事審核設計文件)|5|7

•coding standard|**規範 (為目前的開發制定合適的規範) |7|7

•design|具體設計|10|10

•coding|具體編碼|500|510

•code review|• **複審|5|10

•test|• 測試(自我測試,修改**,提交修改)|20|25

reporting|報告|15|15

••test r1eport|• 測試報告|4|3

•size measurement|計算工作量|5|6

•postmortem & process improvement plan|• 事後總結 ,並提出過程改進計畫|6|6

**對psp分析和總結:**

對比上次的個人專案psp,可以看出本次實驗在計畫,需求分析等方面的用時都相對減少,因為部分需求之前已分析過。本次專案是在上次專案的基礎上實現,按理說在具體編碼方面應用時更少才對,但實際卻恰恰相反,主要原因是本次實驗要實現基於web的人機互動,而我對於web專案又比較生疏,要實現又相當於重新學習一遍,這期間遇到了許多問題像eclipse中伺服器的配置,tomcat伺服器無法啟動,伺服器執行顯示埠占用,web專案jsp報錯,el表示式的使用,還有echarts的學習等等,所以在這方面耗費了大量時間,但經過自己一步一步遇到問題,解決問題還是感覺挺有成就的,往後需要更加努力。

統計英文文字字母出現頻率

使用者需求 英語的26 個字母的頻率在一本 中是如何分布的?某型別文章中常出現的單詞是什麼?某作家最常用的詞彙是什麼?飄 中最常用的短語是什麼,等等。題目要求 1 輸出某個英文文字檔案中 26 字母出現的頻率,由高到低排列,並顯示字母出現的百分比,精確到小數點後面兩位。2 字母頻率 這個字母出現的次...

使用NLTK進行英文文字的分詞和統計詞頻

去停用詞 統計詞頻 生成英文詞云 先將文件讀入,然後全部變為小寫 txt open english.txt r read txt txt.lower 將英文全部變為小寫 中文分詞需要專門的方法 英文分詞就可以直接使用word tokenize 進行分詞 text this is a text for...

C 統計英文文字中的單詞數並排序

思路如下 1.使用的hashtable 高效 集合,記錄每個單詞出現的次數 2.採用arraylist對hashtable中的keys按字母序排列 3.排序使用插入排序 穩定 public void statisticswords string path hashtable ht new hasht...