神經網路多輪對話系統

簡單來講，就是把上下文分別用rnn生成向量，計算兩個向量變換後的內積對應二分類，判斷乙個回答是否是正確回答

**全名：the ubuntu dialogue corpus: a large dataset for research in unstructured multi-turn dialogue systems

2、在多輪對話中，已知前文(context)的時候，面臨一堆候選回答的時候，用怎樣的網路結構能選出正確答案

缺圖其實網路結構極其簡單，把當前的問題，比如「怎麼檢視程序號」，用rnn進行向量化c，即取rnn最後乙個時刻的輸出；與候選的回答，比如「用ps ax來看"用同樣結構的網路生成的向量r，這兩個向量最後轉換成乙個標量，通過sigmoid函式歸到01之間。其實，就是擬合c'=mr，使得相關回答在變換後，與問題相似。

從最後的結果來看，lstm相對原始rnn來說，有巨大的效果提公升，而原始rnn與tfidf的余弦度量得到的結果差不太多

缺圖模型的效果與語料的量有很大關係

缺圖原始語料中只有正例，負例是隨機構造的。

用於翻譯模型的度量bleu不再適用於會話評估。

文中還提到，引數的初始化方式和優化方法也起到關鍵作用，rnn隱層特意用了正交向量來初始化，優化演算法採用"adom"方法，這兩點之後還要細讀一**竟。

既然本質上也是算變換後的相似性，那微軟的相關性模型(dssm系列非對稱型)也適用於這個問題，效果上應當基本是等價的，從經驗來看還有可能更快地收斂，如果原模型難以優化，可以嘗試下成對訓練。

神經網路多輪對話系統

神經網路辨識系統

神經網路卷積神經網路

神經網路卷積神經網路

神經網路多輪對話系統

神經網路辨識系統

神經網路 卷積神經網路

神經網路 卷積神經網路

相關推薦

神經網路卷積神經網路

神經網路卷積神經網路