情感傾向性分析訓練 在輿情系統中的應用

2021-10-09 07:05:34 字數 760 閱讀 6013

1. 情感分析-詞庫搭建

通過對大量中文文字及人物會話分析,發現文字情感的判定基本上通過對通篇的情感詞、程度副詞及否定詞的統計分布來判別,因此,我們搭建了基於情感分析的情感詞庫以及其它輔助詞表。如下圖所示。

圖1 詞典集結構關係圖

其中,正/負面情感詞通過預先標註的新聞資料中通過統計獲得,再人工過濾;程度副詞權重(0.52)則通過多人打分,取平均的方式來預定義(0.52), 否定詞權重統一定為-1.0;

2. 文字情感分析實現

情感傾向性將文字分為正面、負面、中性三種情感屬性,通常由正、負面,以及強弱程度來衡量。本文通過中文分詞處理,基於情感詞典構建情感表,為每乙個分詞打分,從而判斷判別情感傾向,文字情感分析的流程如下圖所示。

3. 建立情感傾向性分析模型

圖4 積極情緒分布環形圖

圖五 消極情緒分布玫瑰圖

文字傾向性分析綜述

2008 10 13 20 50 最近看了兩篇關於文字傾向性分析的碩士學位 金曉鷗 2008 網際網路輿情資訊獲取與分析研究.上海,上海交通大學.肖偉 2007 基於語義的blog社群文字傾向性分析.上海,上海交通大學.總結了一下 1.文字傾向性分析的定義和主要任務 tetsuya nasukawa...

聚類 文字分類 傾向性分析

最近專案和話題檢測 傾向性分析相關,涉及到聚類 文字分類 文字傾向性分析技術,決定形成系統說明並將 開放出來,作為記錄。資料的話,由於和實驗室專案相關,不好開放出來,可以使用搜狗的語料庫 聚類流程 1 文字預處理,包括分詞 去停用詞 統計詞頻等 如果是英文文字的話,還有詞幹還原,如porter演算法...

近期重拾Linux的一點傾向性評價和小結

引言 其實說起與linux的相識,最早還是從十多年前的一張軟盤的中文linux,名字沒記錯應是mclinux 具體出處已忘記了 高中時代大學初期的redhat,後期的ubuntu,後幾年蹭網專用livecd類,包括幾年前常常折騰路由器領域的openwrt,後來伺服器上接觸的是centos,近日因為機...