知識 vs 學習

今天下午師兄做報告，講了知識(knowledge)，怎麼用nlp幫助構建領域知識。

一般解決問題是都有兩種思路：知識的和資料驅動的。一般的看法是，知識就是規則，通過專家建立起複雜的規則系統，然後解決問題就是根據規則進行判定。這其實就是乙個確定性的模型。而資料驅動則是根據資料學習出規則來。學習出來的規則可能是顯式的，比如決策樹學習出來就是顯式的規則（如果屬性1=*** and 屬性2 =yyy 那麼zzz），也可能是隱式的規則，比如svm分類器學出來的引數向量w。

我覺得不管是知識，還是學習的方法，其**都是資料。知識是人通過大量資料總結出來的規律，總結的方法也是統計的，而學習不過是把人的工作也做了而已。人在學習過程中會閱讀前人的書（知識），可能把它作為乙個先驗，然後根據自己的直接經驗，求出後驗概率。所以我覺得貝葉斯統計還是比較合理的。

師兄具體做的是從旅遊景點的網頁裡提取一些知識，構建乙個語義網，然後在之上做一些應用。

基本的常識庫使用的是hownet，去年董老師來我們實驗室做過乙個報告，推銷他的hownet。然後對無結構的文字先做分詞和ner，以及詞性標註，然後做句法分析，最後做語義角色標註。利用標註擴充常識庫。比如頤和園位於北京西郊這句話，能提取位於這個動詞，以及頤和園和北京西郊的關係，然後根據hownet中位於的定義，建立起頤和園這個例項的乙個屬性，它位於北京西郊。

介紹的主要是怎麼構建語義網。推理沒怎麼講。現在的主流做法還是一階謂詞邏輯。我覺得可能用概率推理比較好。因為世界上的事件都是不確定性的，而且概率推理包含確定性推理。

不過垂直搜尋也許會是乙個不錯的應用點，一方面它的資料量相對較少，另一方面它要求更準確的元資料抽取，甚至要做一些推理。

知識 vs 學習

VS學習筆記

深度學習 vs 機器學習 vs 模式識別

被動學習VS自主學習

知識 vs 學習

VS學習筆記

深度學習 vs 機器學習 vs 模式識別

被動學習VS自主學習

相關推薦