情感對話資料集介紹

2021-10-24 18:26:05 字數 1070 閱讀 6766

資料集一、dailydialogue

**《dailydialog_ a manually labelled multi-turn dialogue dataset》。

總共有一萬多對對話,每個對話大概8輪。

資料集眾包含的檔案有:

1)dialogues_text.txt:包含所有的一萬多個對話,每行代表一對對話,對話之間用_eou_隔開,對話結尾也有乙個_eou_。

2)dialogues_topic.txt:每行對應於一對對話所包含的主題,用數字1——10表示,其中1代表日常生活,2代表學校生活,3代表文化和教育,4代表態度和情感,5代表關係,6代表旅遊,7代表健康,8代表工作,9代表政策/政治,10代表經濟。

3)dialogues_act.txt:每行代表對話行為的解釋,用數字1——4表示,其中1代表通知,2代表詢問,3代表指示,4代表同情。

4)dialogues_emotion.txt:每行代表對話所包含的情感,用數字0——6表示,其中0代表沒情感/中性,1代表生氣,2代表厭惡,3代表:恐懼,4代表快樂,5代表悲傷,6代表驚訝。

5)train.zip,validation.zi和test.zip分別代表訓練集、驗證集和測試集,每個檔案下有三個檔案,有對話資訊、情感資訊和行為解釋資訊。

資料集二、meld

該資料集文字資訊裡面包含三種檔案:train_sent_emo.csv、dev_sent_emo.csv和test_sent_emo.csv。每個csv檔案裡包含的資訊有no.,utterance,speaker,emotion,sentiment,dialogue_id,utterance_id,season,episode,starttime,endtime,用逗號隔開。

影評情感分類(基於IMDB資料集)

回顧以前的筆記 在keras中,內建了imdb電影評分資料集,來進行評價 安裝keras conda install kerasconda就幫依賴全部搞定,記得加源 匯入imdb from keras.datasets import imdb資料集簡要說明 在資料中不是單詞,而是單詞的索引 一共就5...

Pascal VOC 資料集介紹

介紹pascal voc資料集 資料格式 衡量方式 voc2007,voc2012 有以下幾個task classification 略過 detection 將中所有的目標用bounding box bbox 框出來 segmentation 將中所有的目標分割出來 person layout 略...

Keras 資料集介紹

基本的使用情況差不多介紹的差不多了,我也是邊學習邊寫部落格,其中難免有很多理解錯誤的地方或者理解不到位的地方,還請各位博友多多指點。python view plain copy print?keras.datasets.cifar10 keras.datasets.cifar10cifar10資料集...