標註精簡過的問題如何匯入問題庫

2022-06-17 11:12:11 字數 328 閱讀 7104

目的:標註團隊會不斷的新增精簡過的問題,如何把這些問題匯入到問題庫,由售後的同事接手寫答案

【迭代】

初始:問題庫里已有130類問題

假設新增問題數共有900條

repeat:

select first question:

匹配問題庫里的所有問題:

if  匹配到了,就將該問題及相似問題,匯入給這個問題(其中,相似問題是演算法跑出來,且經過人工確認的問題)

else 問題庫里沒有匹配,則新增乙個問題,以該問題為標準問題,相似問題也加入到下面

從新增問題中刪除已匯入問題

while(新增問題數!=0)

如何解決大量樣本標註問題

tsvm 常見的解決未標註樣本的方法有em expectation maximization 演算法 協同訓練法,transductive svm 方法及最大熵判別法等.下面首先介紹一下tsvm,並以入侵檢測為例介紹。在傳統的isvm中,訓練svm學習機需要大量經過標記的樣本,而正確標記的樣本是很難...

如何解決過擬合問題?

如何降低過擬合?這是深度學習中非常重要的問題。關於過擬合的相關概念和過擬合帶來的危害,可參考筆者之前的部落格 過擬合與欠擬合簡要總結。如何解決過擬合?1.獲取和使用更多的資料集 對於解決過擬合的辦法就是給與足夠多的資料集,讓模型在更可能多的資料上進行 觀察 和擬合,從而不斷修正自己。然而事實上,收集...

過沙漠的問題

這是去哪兒的一道筆試題 乙個人穿過沙漠需要步行80公里,每步行一公里需要消耗1公升的水,但是每個人最多能帶60公升水,問這個人應該怎樣通過沙漠?要是步行81公里需要多少水?就是在20公里處要保證有60公升水才行,先帶60公升水在20公里處放下20公升水。然後回去帶60公升水在20公里處消耗了20公升...