java字串相似度演算法

2021-08-17 21:50:00 字數 1703 閱讀 5882

按順序匹配的,**如下:

/**

* 判斷兩個字串相似度,可設定level

*@param

strsource

原字串

*@param

strcompared

比較字串

*@param

level

評分閥值

*@param

morecount

比較字串比原字串多多少個限制

*@return

*/public staticboolean issimilar(string strsource,string strcompared,intlevel,intmorecount)

intcount=strsource.length();

intmaxsamecount=0;

//遍歷count次

for(inti=0;iintnowsamecount=0;

intc=0;

intlastindex=0;//記錄上一次匹配的目標索引

//遍歷每一次的原字串所有字段

for(intj=i;jcharcharsource=strsource.charat(j);

for(;ccharcharcompare=strcompared.charat(c);

if(charsource==charcompare)

}c=lastindex;//遍歷完目標字串,記錄當前匹配索引

}if(nowsamecount>maxsamecount)

}//大於原字串數量的情況

if(maxsamecount>count)

doubledlv= (double)100*maxsamecount/count;

intilv=10*maxsamecount/count*10;

intcha=(int)dlv-ilv;

intyu=cha>5?1:0;

ilv+=yu*10;

if(ilv/10>=level)else

}

Java字串相似度匹配

原文 package com.xfl.boot.common.utils created by xfl time on 2018 11 16 0 10 description public class similarityutils param str1 param str2 public stat...

字串相似度

這個演算法 於網上,但忘記了出處,對其使使用了 issame封裝,然後用在了自己的網頁資料抓取 中。求解兩個字串的相似度int calculatestringdistance const string stra,const string strb intret c lena 1 lenb 1 for...

字串相似度

最近要對字串進行聚類,這些字串都是 的輸出,嘗試了幾種字串相似度度量的方法 levenshtein距離 字串核函式 lcs max len str1,str2 其中相似度用公式distance 1.0 similarity 1轉換為距離.使用層次聚類方法.下面是要聚類的字串 points aabbc...