鏈結分析演算法在網路輿情熱點

2021-10-09 08:45:37 字數 1239 閱讀 4123

原理:pagerank演算法原理

在輿情熱點挖掘中引入 pagerank演算法思想,構造輿情網路,單個節點的重要性來 自于該網路中其 他成員節點重要性的線性組合,從而建構乙個線性方程組, 輿情網路 中各節點的重要性即該線性方程組最大特徵值所對應的特徵向量。

以下演算法可以用來描述輿情絡 的熱點挖掘過程 :

(1)取 n個直接或間接鏈結關係的頁面構建輿情網路,每個頁面為該網路的節點 ;

(2)建立該輿情網路的鄰接矩陣a,其中aij=1表示節點 i與節點j之間存在直接連線;aij=0表示節點i與節點j之間不存在直接連線 ; λ 表示矩陣a的主特徵值,主特徵值 λ 的特徵向量用 e表示 , 即e= (e1,e2,⋯,en );

(3)定義 xλ =ax , 有 :

使用公式( 3) 計算輿情網路節點的特徵向量值, 降序後輸出, 得到輿情熱點。

應用例項:

以上圖所示的簡單輿情網路中標註的a、 b、 c、 d這4個節點為例,使用pagerank方法, 通過計算 4個節點的特徵 向量挖掘**熱點。節點 a處於該輿情網路中心位置,通過 計算得知其特徵向量值為1.2,說明了 a節點的核心地位;網路節點 b的特徵向量值為1.14,位居其 次;網路節點 c的特徵向量值為1.01;網路節點 d的特徵向量值為 0.71, 其重要性即熱度相對最低。

原理:hits演算法原理

在輿情熱點挖掘中引入hits演算法基本思想,將網頁內容核心度對映為輿情網路中節點核心度,用c表示;對網頁內容核心的附屬關係則對映為輿情網路中節點的趨近核心度,用n表示.以下演算法可以用來描述輿情網路的熱點挖掘過程:

(1)用頁面和鏈結關係建立輿情網路,構造演算法的初始集合s,s中的元素為輿情網路的任意個節點p,節點數m=200;

(3)計算s中所有輿情節點p的核心度值pc和趨近核心度值pn,分別用式(1)和(2)表示

其中:各輿情節點的核心度值c和趨近核心度值n均初始化為1;

(4)對步驟3進行迭代,直至pc與pn趨於穩定;

(5)將計算所得輿情節點的核心度值pc進行降序排列後輸出,得到輿情熱點.

參考:《網路輿情熱點挖掘演算法研究與實現》黃敏 

網路輿情怎麼分析研判的方案

面對網際網路上易發高發的輿情突發事件,處理不及時,就會形成社會 熱點。問題是網路資訊又是7 24小時無休止的傳播擴散,若無法做到及時監測,盡早分析研判輿情,就談不上及時主動處理。因此,做好網上輿情監測研判工作是輿情危機處理的前提。那麼,網路輿情怎麼分析研判呢?網路輿情怎麼分析研判的方案,如下 1.建...

nagle演算法在網路程式設計的作用

tcp ip協議中,無論傳送多少資料,總是要在資料前面加上協議頭,同時,對方接收到資料,也需要傳送ack表示確認。為了盡可能的利用網路頻寬,tcp總是希望盡可能的傳送足夠大的資料。乙個連線會設定mss引數,因此,tcp ip希望每次都能夠以mss尺寸的資料塊來傳送資料 nagle演算法就是為了盡可能...

鏈結分析演算法之 SALSA演算法

salsa演算法的初衷希望能夠結合pagerank和hits演算法兩者的主要特點,既可以利用hits演算法與查詢相關的特點,也可以採納pagerank的 隨機遊走模型 這是salsa演算法提出的背景。由此可見,salsa演算法融合了pagerank和hits演算法的基本思想,從實際效果來說,很多實驗...