python中文問答系統 基於語料庫的問答系統

2021-10-18 14:33:54 字數 1171 閱讀 8621

將乙個問題及其答案(假設只有乙個)作為lucene中的乙個文件來考慮。lucene支援文件的字段檢視;因此在構建文件時,請將問題設為可搜尋字段。一旦檢索到給定查詢問題的排名靠前的問題,請使用document類的get方法返回答案。

**框架(自己填寫)://index

indexwriterconfig iwcfg = new indexwriterconfig(new standardanalyzer());

indexwriter writer = new indexwriter(...);

document doc = new document();

doc.add(new field("field_question", questionbody, field.store.yes, field.index.analyzed));

doc.add(new field("field_answer", answerbody, field.store.yes, field.index.analyzed));

// search

indexreader reader = new indexreader(..);

indexsearcher searcher = new indexsearcher(reader);

queryparser parser = new queryparser("field_question", new standardanalyzer());

query q = parser.parse(queryquestion);

topdocs topdocs = searcher.search(q, 10); // top-10 retrieved

// accumulate the answers from the retrieved questions which

// are similar to the query (new) question.

stringbuffer buff = new stringbuffer();

for (scoredoc sd : topdocs.scoredocs) {

document retrieveddoc = reader.document(sd.doc);

system.out.println("generated answer: " + buff.tostring());

PAT中文1001 1005(Python 語言)

今日先來無聊就把1001 1005的題目刷了一遍,題目本身沒有難度,主要是為了熟練我最近學的python,好了正文開始。由於第一題是直接在文字框裡敲 所以沒儲存下來,而且也不難,就不貼 了 1002 很簡單只需要乙個陣列即可,主要是ord 函式的使用 chinese ling yi er san s...

基於深度學習問答系統中的語義相似度計算

問答系統,簡稱qa,是自然語言處理領域的一類經典問題。問答系統的模式基本上分為兩類 1.由輸入的問題在n個候選答案中選取乙個最佳的答案。2.由輸入的問題在已有的問題中選取乙個語義最相似的問題,將該已有問題的答案作為最終的答案返回。第一種問答系統類似與京東客服的自動回答系統,很多使用過京東客服或是 客...

基於移動端的問答系統 需求分析與原型設計

1 結對者 2015034643032 孔潭活 2015034643023 周巨集傑2 需求分析模型 nabcd 模型 3 原型設計工具 axure rp 8 墨刀 fscapture 大學生作為社會新技術 新思想的前沿群體,在大學期間能否將自己鍛造成特色鮮明的應用型人才尤為重要,而這款基於移動端的...