情感對話資料集介紹

資料集一、dailydialogue

**《dailydialog_ a manually labelled multi-turn dialogue dataset》。

總共有一萬多對對話，每個對話大概8輪。

資料集眾包含的檔案有：

1）dialogues_text.txt:包含所有的一萬多個對話，每行代表一對對話，對話之間用_eou_隔開，對話結尾也有乙個_eou_。

2）dialogues_topic.txt:每行對應於一對對話所包含的主題，用數字1——10表示，其中1代表日常生活，2代表學校生活，3代表文化和教育，4代表態度和情感，5代表關係，6代表旅遊，7代表健康，8代表工作，9代表政策/政治，10代表經濟。

3）dialogues_act.txt：每行代表對話行為的解釋，用數字1——4表示，其中1代表通知，2代表詢問，3代表指示，4代表同情。

4）dialogues_emotion.txt:每行代表對話所包含的情感，用數字0——6表示，其中0代表沒情感/中性，1代表生氣，2代表厭惡，3代表:恐懼，4代表快樂，5代表悲傷，6代表驚訝。

5）train.zip，validation.zi和test.zip分別代表訓練集、驗證集和測試集，每個檔案下有三個檔案，有對話資訊、情感資訊和行為解釋資訊。

資料集二、meld

該資料集文字資訊裡面包含三種檔案：train_sent_emo.csv、dev_sent_emo.csv和test_sent_emo.csv。每個csv檔案裡包含的資訊有no.,utterance,speaker,emotion,sentiment,dialogue_id,utterance_id,season,episode,starttime,endtime，用逗號隔開。

情感對話資料集介紹

影評情感分類（基於IMDB資料集）

Pascal VOC 資料集介紹

Keras 資料集介紹

情感對話資料集介紹

影評情感分類（基於IMDB資料集）

Pascal VOC 資料集介紹

Keras 資料集介紹

相關推薦