清華大學開源OpenKE 知識表示學習平台

2021-08-10 08:21:33 字數 2346 閱讀 8196

清華大學自然語言處理實驗室近日發布了 openke 平台,整合了 transe、transh、transr、transd、rescal、distmult、hole、complex 等演算法的統一介面高效實現,以及面向 wikidata 和 freebase 預訓練知識表示模型。該專案旨在為開發者與研究人員提供便利。
github:

openke 是乙個開源的知識表示學習平台,由 thunlp 基於 tensorflow 工具包開發。在 openke 中,我們提供了快速和穩定的工具包,包括最流行的知識表示學習(knowledge representation learning,krl)方法。該框架具有容易拓展和便於設計新的知識表示學習模型的特點。

該框架有如下特徵:

基準測試

一些資料集如 fb15k、fb13、wn18 和 wn11 通常用於知識表示學習的基準測試。我們以 fb15k 和為 wn18 為例介紹我們的框架的輸入檔案的格式。

資料集有以下五種格式:

fb15k、wn18:

fb13、wn11:

工具包我們提供了多個知識表示學習的工具包,包括以下四個資源庫:

openke

這是乙個基於 tensorflow 的知識表示學習(krl)的高效實現。我們使用 c++實現了一些基礎操作,如資料預處理和負取樣。每乙個特定的模型都用 tensorflow 和 python 介面實現,因此能方便地在 gpu 上執行模型。

openke 提供了訓練和測試多種 krl 模型的簡易介面,無需在冗餘資料處理和記憶體控制上花費太多功夫。openke 實現了一些經典和高效的模型用於支援知識表示學習,這些模型包括:

我們提供了訓練這些模型的教程:

此外,我們還使用一些簡單的例子展示了如何基於 openke 構建乙個新模型。

kb2e

kb2e 是一些知識嵌入模型的早期實現,我們之前的研究中使用了很多資源。這些**將被逐漸納入新框架 openke。這是乙個基礎且穩定的知識圖譜嵌入工具包,包括 transe、transh、transr 和 ptranse。該工具包的實現遵循模型的原始檔案設定,使其在研究實驗中保持穩定。

fast-transx

這是 transe 及其擴充套件模型用於知識表示學習的高效輕量級實現,包括 transh、transr、transd、transparse 和 ptranse。整個框架的底層設計為實現加速作出改變,且該框架支援多執行緒訓練。fast-transx 旨在使用 openke 框架實現快速、簡單的部署。

tensorflow-transx

openke 基於 tensorflow 的簡易版,包括 transe、transh、transr 和 transd。與 fast-transx 類似,tensorflow-transx 旨在避免使用 openke 框架產生的複雜封裝。

預訓練嵌入

現有大規模知識圖譜使用 openke 對嵌入進行預訓練(目前都通過 transe 進行訓練。必要時會介紹更多模型)。

知識圖譜和嵌入包括以下五個檔案:

蓋茨清華大學演講

尊敬的顧校長,清華大學的老師 同學們 獲得清華大學這所世界一流大學的榮譽博士學位,讓我感到非常榮幸。清華是所有著百年歷史的名校,這裡誕生了很多傑出的科學家 商業和政治領袖。我上一次造訪貴校是在1997年。當時,貴校學生的才華 熱情和創造性給我留下了很深的印象。之後,我決定在中國設立微軟研究院。在沈向...

清華大學 自學能力

一 永遠不要說你已經盡力了 我在高中時體育特別差,跑1000公尺都很要命,從來都是不及格。到了清華之後,第一節體育課,老師告訴我們每年要測3000公尺長跑,跑不過不許畢業,取消推研資格。怎麼辦?於是每天晚上10 30,我們的自習教室關門,操場上的人就多起來了。跑半個小時再回寢室繼續學習,練了乙個學期...

查詢學生資訊 清華大學

牛客網題目鏈結 排序題。先儲存再查詢 include include include include include include include include include include using namespace std const int n 1005 typedef pair i...