揚我國威,來自清華的開源專案火爆Github

2022-09-10 12:51:25 字數 1289 閱讀 8134

前幾天tj君跟大家分享了幾個有趣的github專案(加密解密、食譜、新冠序列,各種有趣的開源專案github上都有),其中呢,有不少是來自史丹福大學的專案,當時tj君就不由得想,什麼時候能看到的專案都是我**名校,例如清華北大的出品呢?

是不是聽上去特別高大上?

但肯定很多小夥伴自豪的同時腦海中浮現出乙個問題,什麼是反向詞典?

那麼如果你想表達最好的意思,卻一下子忘記了頂呱呱的說法,這可怎麼辦呀?反向詞典就是派這個用途,讓你反向通過解釋查到你想表達的詞語!

清華大學的萬詞王就是利用之前其發布的**中提到的多通道反向詞典模型:multi-channel reverse dictionary model訓練達到這個效果,很多人可能對此不以為然,但要知道醫學上可是專門有個症狀叫做「舌尖現象」(tip-of-the-tongue,又稱話到嘴邊說不出來),反向詞典正好可以解決這個問題。

尤其是對於現在的年輕人來說,電子裝置的發展讓大家接觸傳統書本、書寫漢字的機會越來越少,往往有時候話到嘴邊說不出來。

反向字典支援漢語、漢英、英漢、英語,四種不同的形式:

我們以中文為例來看下,比如tj君想搜尋乙個跟嫵媚有關的詞彙,搜尋結果是這樣的:

看到這麼多查詢結果,首先tj君的第一感覺就是覺得自己詞彙的匱乏,同時萬詞王在搜尋的結果上還允許使用者進行字數、筆畫、詞性、拼音、詞型、韻腳、相關性的進一步高階搜尋,方便小夥伴找到最適合自己想表達意思的詞語,不得不對清華的這個專案翹個大指拇點個贊。

萬詞王的資料基礎取自中華新華字典資料庫,也是在github上開源的專案,包括了各種歇後語,成語,詞語,漢字。確保了反向字典的正確性。

tj君會一併分享給大家,包括前文提到的多通道反向詞典模型**,所以想學習的小夥伴,趕緊來和清華學子們一起切磋切磋吧: