2019常用NLP標註工具簡單介紹

2021-10-01 15:37:35 字數 973 閱讀 6202

yedda:(2016)(python)(可以在windows上裝)

優點是安裝方便,程式很小,標註方便,如果要實現給同乙個實體加多個標籤,也可以實現。最大標籤數8,介面也還過的去。

doccano:(2019)(可以在windows上裝)

支援命名實體識別情感分類機器翻譯任務,介面比較友好。

prodigy(2017):

實體標註分類標註情感標註,都是英文的,功能最全的。

chinese-annotator:(2017)

基於prodigy的中文標註工具

brat:(2010)

支援實體、關係、事件抽取的標註。可以標註情感

優點在標註實體的同時可以進行關係標註,還可以實現二級標註。

** iepy

主要用來資訊抽取關係抽取任務

deepdive:

主要用來關係抽取任務,17就停止更新了

個人小結

​ 大致可以選用brat,doccano,yedda,prodigy試一下,選用brat是因為有現成的中文情感標註,還有brat有關係標註,選用doccano是它的頁面很友好,而且可新增的標籤數也比較多,選用yedda是它完全用python桌面開發且支援中文,選用prodigy是因為支援標註的功能最全。

NLP標註工具Brat

文字標註 文字標註工具brat的使用 2019常用nlp標註工具簡單介紹 nlp標註工具 yedda 2016 python 可以在windows上裝 優點是安裝方便,程式很小,標註方便,如果要實現給同乙個實體加多個標籤,也可以實現。最大標籤數8,介面也還過的去。doccano 2019 可以在wi...

開源NLP文字標註工具CatchingFire

做過nlp相關工作內容的小夥伴應該都知道標註資料才是最花時間的部分,因此乙個好用的標註工具來提高標註效率尤為重要。調研了多個開源工具後,發現現有大多數標註工具都只是簡單的標註功能,並沒有利用模型智慧型輔助標註。因此閒暇之餘開發了標註工具catchingfire 因為標註工具雖然看起來不重要,但是在n...

NLP常用工具

nlp常用工具 各種工具包的有效利用可以使研究者事半功倍。以下是nlp版版友們提供整理的nlp研究工具包。nlp toolbox clt gate natural language toolkit nltk mallet opennlp english stemmer snowball englis...