整合多個網路的拓撲結構並降維(Mashup)

2022-08-26 15:12:20 字數 2367 閱讀 2752

整合多個網路的拓撲結構並降維(mashup)

文章想利用網路的拓撲結構資訊來整合多個網路,利用提取的拓撲資訊和資料的其他資訊來推斷節點的屬性。比如利用整合後的網路和提取的拓撲資訊為基因或蛋白質**功能。大體流程如下:

(1)對每個網路採用重啟隨機遊走,獲得每乙個節點的乙個分布,捕獲其與網路中其他所有節點的相關性。(網路中n個節點,則每個節點得到乙個n維向量);

(2)構造乙個多項邏輯模型來近似每個節點由隨機遊走得到的n維向量,模型的引數為兩個低維特徵向量(

w, x向量),兩個低維向量可以通過最小化模型向量和隨機遊走得到的擴散向量之間的差異得到;

(3)使用得到的低維向量(x向量)作為廣泛的基於網路的功能推理任務的輸入特徵。

接下來我們說說每一步具體的步驟,首先我們說一下資料,現在有k個網路,每個網路有n個節點,每個網路的節點是一樣的,但是邊的連線不同。現在簡單介紹一下重啟隨機遊走演算法:

重啟隨機遊走(random walk with restart)在分析網路結構上已經有很多的應用了。從初始節點出發,下一步走向哪個節點是由概率決定的。現在有乙個(加權的)分子相互作用網路g

=(v,e),有n個節點,每個節點表示乙個基因或乙個蛋白質,設該網路的鄰接矩陣為a,轉移概率矩陣為b,其中b

ij表示節點j到節點i的轉移概率,計算公式如下:

從節點i開始的重啟隨機遊走定義為:

pr:重啟的概率,在擴散過程中控制區域性和全域性拓撲資訊的相對影響,重啟概率比較大則說明區域性結構更重要;ei

:n維的分布向量,ei(

i)= 1且ei(

j)= 0,

任意 j≠i;s

ti:n維分布列向量,每一項表示從節點i出發經過t步後到達該節點的概率;

上式的第一項可以看做從與當前節點連線的其他節點繼續更新的更新項,第二項為重啟項。經過多次迭代後可以為每個節點計算乙個n維的向量si。

①我們應用上面的重啟隨機遊走方法對網路1中的每個節點i計算乙個n維向量s

i,(也稱為擴散向量或擴散狀態)s

ij表示從節點i出發到達節點j的概率;

②降維  因為我們拿到的資料本身是有雜訊的,並且得到的擴散向量都是n維的,若n比較大,則在後續計算中耗時非常大(生物網路中的節點一般都在2萬多,可見維度太大)。

那麼我們如何降維呢?

我們利用多項邏輯模型為每乙個擴散向量s

i構建乙個模型向量

,讓模型向量近似擴散向量,使得它們之間的差異很小。我們用的邏輯模型為softmax,模型向量的每一項如下:

其中x, w的維度一樣,我們設為d維,且d << n。

k:一共的類別數;

x:特徵向量;

θ:回歸引數

我們用x

i替換x,w

j替換θ

j,則定義式如下:

:表示從節點i轉移到節點j的概率,我們可以理解為把i分類到類別j的概率(n個節點看做n個類別)

我們使用kl-散度來計算兩個向量之間的差異,將差異最小化得到x, w向量。

我們用模型向量

近似擴散向量si

,隨後用模型中的x, w向量分別表示節點的特徵向量和引數向量。這樣就將原先的n x n矩陣變為n x d矩陣。

接下來我們擴充套件到k個網路中:

w向量視為網路特異性上下文向量,共k x n個,x向量為節點的特徵向量,在k個網路中實現共享,也就是利用x向量做到整合k個網路的目的,共n個。

w : k x n個,在計算模型向量時,作為節點特徵向量的引數,根據網路的不同而不同,反映了網路的特異性;

x:n個,節點的特徵向量,因為文章方法的目的就是整合網路的拓撲,因此採用的方式為:將k個網路中節點的x向量共享從而達到整合的目的。

此時我們對k個網路中近似擴散向量的softmax用以下公式:

其中x向量並沒有上標k,說明x向量在k個網路中是一樣的。求解x, w向量的函式如下:

我們計算出x, w向量後,就可以利用節點的x向量來做資料相關分析了。

文獻:compact integration of multi-network topology for functional analysis of genes(

網路的拓撲結構

廣義上來說拓撲是指研究與大小 性狀無關的點 線的方法。我們引用到計算機網路的學習中,能夠更加形象的體現網路在我們身邊的存在像是。在計算機網路中我們經常使用拓撲結構來反映網路中各實體的結構關係,即把網路中的工作站,伺服器作為 點 電纜作為 線 星型拓撲結構 每個結點都由一條單獨的通訊線路與中心結點鏈結...

網路的拓撲結構

網路拓撲是網路形狀 主要有星型結構 環型結構 匯流排結構 分布式結構 樹型結構 網狀結構 蜂窩狀結構等。what 網路拓撲結構是指用傳輸 互連各種裝置的物理布局,why 規劃網路 how 把網路中的計算機等裝置連線起來 每一種網路結構都由結點 鏈路和通路等幾部分組成。1 結點 它是網路系統中的各種資...

網路基礎 網路的拓撲結構

網路拓撲結構是指用傳輸 互聯各種裝置的物理布局。將參與 lan工作的各種裝置用 互聯在一起有多種方法 實際上只有幾種方式能適合 lan的工作。如果乙個網路只連線幾台裝置 最簡單的方法是將它們都直接相連在一起,這種連線稱為點對點連線。用這種方式形成的網路稱為全網際網路絡 如下圖所示。圖中有6個裝置,在...