詞頻統計作業 第一次軟工作業

2022-08-31 14:21:12 字數 654 閱讀 9431

只是一些簡單感想。

之前沒有學過c++和c#,老師上來就這麼自主地布置了乙個這樣的作業確實有點出乎意料。

之前團隊作業要求採訪學長,學長的印象是每週要花10h以上在軟工,**均1000行+,這回寫第一次作業,讓沒有基礎的我體會到了學長的話。這個作業花了大約15h的時間。其中除錯占用了12h。查閱了很多資料,還是覺得一口吃成胖子不是乙個現實明智的想法,希望以後能著邊際。

使用vs2012自帶的**分析工具,前面的時間是把各個搜尋到的子檔案的內容寫到乙個大檔案裡面(浪費時間),接下來是對這個大檔案進行詞頻統計,也是最耗cpu的地方。

至今有乙個很奇葩的bug。調了近5h還是沒調出來:

在控制台下輸入資料夾目錄a,可以只在輸入的目錄a下面進行遞迴地詞頻統計,最後在目錄a下面生成目標檔案。

只將輸入目錄換成命令列引數讀取,就會在目錄a的所有子目錄a、b、c、d、e、f、g...下面都有目標檔案,並只是各自

統計各自資料夾裡的詞頻。沒有達到要求。

測試用例:流傳的21m測試用例,和自己用**增添的乙個20m左右的txt檔案(即1圖),後來發現上面的bug,經過除錯之後在控制台輸入下解決了問題。使用更為複雜的流傳的21m用例後,速度也有了明顯的提公升。

第一次軟工作業

031702446 我是林巨集海 我的愛好是活著 最近喜歡玫瑰園一樓的荔枝肉很好吃!最近在聽拉拉打雷的肉桂女孩聽了很想吃肉桂 好好學習 第一我不叫喂.閱讀思考 2.1 回想一下你初入大學時對計算機專業的暢想 2.1.1 當初你是如何做出選擇計算機專業的決定的?因為身份戶籍的關關係當初比正常高考生低很...

第一次軟工作業

很久沒在寫點東西發出來了,我也不知道寫些什麼,直到這次軟工實踐作業的到來,我重新撿起了被我冷落的markdown 031702345 我是妙手回春關文濤 我的愛好是折騰電腦,學習新的技術 我最喜歡沙茶面 丁香一層 好運來 不知道說什麼好。1 回想一下你初入大學時對計算機專業的暢想 我從小學開始喜歡折...

軟工作業 詞頻統計

1 讀檔案到緩衝區 process file dst def process file dst try f open dst,r 開啟檔案 except ioerror ass print s return none try bvffer f.read 讀檔案到緩衝區 except print re...