第一次個人程式設計作業

def one_hot(word_dict, keywords):  
cut_code = [word_dict[word] for word in keywords]
cut_code = [0]*len(word_dict)
for word in keywords:
cut_code[word_dict[word]] += 1
return cut_code

def extract_keyword(content):  
re_exp = re.compile(r'()|(]+>)', re.s)
content = re_exp.sub(' ', content)
content = html.unescape(content)
seg = [i for i in jieba.cut(content, cut_all=true) if i != '']
keywords = jieba.analyse.extract_tags("|".join(seg), topk=200, withweight=false)
return keywords

計算模組介面部分的效能改進

消耗最大的部分

如圖所示，主函式消耗最大，符合預期

效能分析圖

計算模組部分單元測試展示

測試結果：

執行之後的結果如下圖所示

較為符合預期。

部分測試**：

if __name__ == '__main__':
encoding="utf-8") as y1:
content_x1 = x1.read()
content_y1 = y1.read()
similarity = cosinesimilarity(content_x1, content_y1)
similarity = similarity.main()
print('相似度: %.2f%%\n' % (similarity * 100))
encoding="utf-8") as y2:
content_x2 = x2.read()
content_y2 = y2.read()
similarity = cosinesimilarity(content_x2, content_y2)
similarity = similarity.main()
print('相似度: %.2f%%\n' % (similarity * 100))
encoding="utf-8") as y3:
content_x3 = x3.read()
content_y3 = y3.read()
similarity = cosinesimilarity(content_x3, content_y3)
similarity = similarity.main()
print('相似度: %.2f%%\n' % (similarity * 100))
encoding="utf-8") as y4:
content_x4 = x4.read()
content_y4 = y4.read()
similarity = cosinesimilarity(content_x4, content_y4)
similarity = similarity.main()
print('相似度: %.2f%%\n' % (similarity * 100))
encoding="utf-8") as y6:
content_x6 = x6.read()
content_y6 = y6.read()
similarity = cosinesimilarity(content_x6, content_y6)
similarity = similarity.main()
print('相似度: %.2f%%\n' % (similarity * 100))
encoding="utf-8") as y7:
content_x7 = x7.read()
content_y7 = y7.read()
similarity = cosinesimilarity(content_x7, content_y7)
similarity = similarity.main()
print('相似度: %.2f%%\n' % (similarity * 100))
encoding="utf-8") as y8:
content_x8 = x8.read()
content_y8 = y8.read()
similarity = cosinesimilarity(content_x8, content_y8)
similarity = similarity.main()
print('相似度: %.2f%%\n' % (similarity * 100))
encoding="utf-8") as y9:
content_x9 = x9.read()
content_y9 = y9.read()
similarity = cosinesimilarity(content_x9, content_y9)
similarity = similarity.main()
print('相似度: %.2f%%\n' % (similarity * 100))
encoding="utf-8") as y0:
content_x0 = x0.read()
content_y0 = y0.read()
similarity = cosinesimilarity(content_x0, content_y0)
similarity = similarity.main()
print('相似度: %.2f%%\n' % (similarity * 100))

設計空白對比文件和完全一致的文件

完全不同對比文件的結果：

沒有異常。

完全一致文件的結果：

沒有異常。

psp2.1

personal software process stages

預估耗時（分鐘）

實際耗時（分鐘）

planning

計畫30

60estimate

估計這個任務需要多少時間

2020

development

開發480

480analysis

需求分析 (包括學習新技術)

300300

design spec

生成設計文件

6030

design review

設計複審

3010

coding standard

**規範 (為目前的開發制定合適的規範)

3010

design

具體設計

6060

coding

具體編碼

300300

code review

**複審

3030

test

測試（自我測試，修改**，提交修改）

12090

reporting

報告60

80test repor

測試報告

3020

size measurement

計算工作量

3015

postmortem & process improvement plan

事後總結, 並提出過程改進計畫

4035

total

合計1620

1600

我禿了也強了？？

第一次個人程式設計作業

psp2.1 personal software process stages 預估耗時分鐘實際耗時分鐘 planning 計畫120 estimate 估計這個任務需要多少時間 120development 開發360 analysis 需求分析包括學習新技術 60 design spec...

第一次個人程式設計作業

github倉庫位址 psp2.1 personal softwareprocess stages 預估耗時分鐘實際耗時分鐘 planning 計畫50 60estimate 估計這個任務需要多少時間 3020 development 開發960 1080 analysis 需求分析包括學習...

第一次個人程式設計作業

倉庫 psp2.1 personal software process stages 預估耗時分鐘實際耗時分鐘 planning 計畫 estimate 估計這個任務需要多少時間100 development 開發 8802000 analysis 需求分析包括學習新技術 240420 de...

第一次個人程式設計作業

第一次個人程式設計作業

第一次個人程式設計作業

第一次個人程式設計作業

相關推薦