對比兩個檔案相似度 余弦演算法

2022-05-10 06:33:39 字數 875 閱讀 1705

檔案a1 包含字元bi 的個數bin1,檔案a2 包含的字元bi 的個數bin2 

利用余弦演算法:   相似度 = (b1n1*b1n2 +b2n1*b2n2+....+bin1*bin2)/(math.sqrt(b1n1^2 +b2n1^2+....+bin1^2)*math.sqrt(b1n2^2 +b2n2^2+....+bin2^2).

math.sqrt() 代表開方。

具體**如下:

public

class

similardegreebycos

}strarray = str2.split(" ");

for(int i=0; ii)

}//計算相似度

double vector1modulo = 0.00;//

向量1的模

double vector2modulo = 0.00;//

向量2的模

double vectorproduct = 0.00; //

向量積 iterator iter =vectorspace.entryset().iterator();

while

(iter.hasnext())

vector1modulo =math.sqrt(vector1modulo);

vector2modulo =math.sqrt(vector2modulo);

//返回相似度

return (vectorproduct/(vector1modulo*vector2modulo));

}/**

*/public

static

void

main(string args)

}

pytorch計算兩個特徵的余弦相似度

首先,我們要記住一點,兩個特徵的余弦相似度計算出來的範圍是 1,1 其實,對於兩個特徵,它們的余弦相似度就是兩個特徵在經過l2歸一化之後的矩陣內積。如下 import torch import torch.nn.functional as f 假設feature1為n c w h,feature2也...

相似度演算法之余弦相似度

余弦距離,也稱為余弦相似度,是用向量空間中兩個向量夾角的余弦值作為衡量兩個個體間差異的大小的度量。余弦值越接近1,就表明夾角越接近0度,也就是兩個向量越相似,這就叫 余弦相似性 上圖兩個向量a,b的夾角很小可以說a向量和b向量有很高的的相似性,極端情況下,a和b向量完全重合。如下圖 如上圖二 可以認...

求A和B兩個特徵向量的余弦相似度

現有兩個特徵向量a和b,分別表示為 a x1,x2,x3 b y1,y2,y3 則求a和b向量的余弦相似度。a x1 y1 x2 y2 x3 y3 b sqrt x1 2 x2 2 x3 2 sqrt表示求平方根 c sqrt y1 2 y2 2 y3 2 cos a,b a bc 同理當a個b擴到...