中文情感分析語料庫

2021-08-10 06:43:45 字數 532 閱讀 5049

中文情感分析語料庫

中文情感分析的語料庫非常少,這五個中文語料庫是我在網上的蒐集的。

url:

資料集2:2023年ccf自然語言處理與中文計算會議:中文微博情感分析測評資料

url:

條微博,共約 20000 條微博。資料採用xml格式,已經預先切分好句子。每條句子的所有標註資訊都包含在元素的屬性中。其中opinionated表示是否觀點句,polarity表示句子情感傾向。

資料集3:中文情感挖掘語料-chnsenticorp

url :

說明:語料庫涉及3個領域:酒店、電腦(筆記本)與書籍

去重後語料:

資料集4:豆瓣網影評情感測試語料

url:

資料集5:semeval-2016

url:

訓練資料

測試資料

句子級數

句子級數

移動手機

1406330

1405784

數碼產品

603191

602556

中文情感分析語料庫

原文 中文情感分析的語料庫非常少,這五個中文語料庫是我在網上的蒐集的。url 資料集2 2012年ccf自然語言處理與中文計算會議 中文微博情感分析測評資料 url 條微博,共約 20000 條微博。資料採用xml格式,已經預先切分好句子。每條句子的所有標註資訊都包含在元素的屬性中。其中opinio...

用BRAT進行中文情感分析語料標註

1.背景 情感分析是nlp中的一大分支,無論在學術界還是工業界都有廣泛的研究,在semeval語義分析會議中有單獨的情感分析任務分支,其中最難的乙個任務叫做absa aspect based sentiment analysis,面向方面的情感分析。舉例來說,就是對以下句子,新版本英雄的 很不錯,但...

python中文問答系統 基於語料庫的問答系統

將乙個問題及其答案 假設只有乙個 作為lucene中的乙個文件來考慮。lucene支援文件的字段檢視 因此在構建文件時,請將問題設為可搜尋字段。一旦檢索到給定查詢問題的排名靠前的問題,請使用document類的get方法返回答案。框架 自己填寫 index indexwriterconfig iwc...