IKAnalyzer 中文分詞 高亮

2021-09-30 14:50:17 字數 1429 閱讀 7120

建立索引

public void execute() 

public void creatcspindex(indexwriter iwriter)

document doc = new document();

doc.add(new field("title",key,field.store.yes,field.index.analyzed));

doc.add(new field("content",contmap.get(key),field.store.yes,field.index.analyzed));

iwriter.adddocument(doc);

}

搜尋 高亮

directory directory = null;

indexsearcher is = null;

topdocs topdocs2 = null;

string keyword = "第二章提示使用者要求另外收費";

query query2 = ikqueryparser.parse("content", keyword); //

file indexdir = new file(path);

directory = ******fsdirectory.open(indexdir);

indexreader reader = indexreader.open(new ******fsdirectory(

indexdir));

is = new indexsearcher(reader);

is.setsimilarity(new iksimilarity());

topdocs2 = is.search(query2, 5);//搜尋前5個最相似的

scoredoc scoredocs = topdocs2.scoredocs;

//高亮設定

analyzer analyzer = new ikanalyzer();//設定分詞器

//設定高亮顯示的格式,也就是對高亮顯示的片語加上字首字尾

******htmlformatter ******htmlformatter = new ******htmlformatter("","");

highlighter highlighter = new highlighter(******htmlformatter,new queryscorer(query2));

highlighter.settextfragmenter(new ******fragmenter(150));

//設定每次返回的字元數.想必大家在使用搜尋引擎的時候也沒有一併把全部資料展示出來吧,當然這裡也是設定只展示部分資料

for(int i=0;i

solr 實現 中文分詞,IK Analyzer

solr 預設是不支援中文分詞的,這樣就需要我們手工配置中文分詞器,在這裡我們選用 ik analyzer 中文分詞器。ik analyzer 如圖 solr 在這裡我們使用 solr 4.10.4 版本試驗環境 centos 6.5 jdk1.7 整合步驟 1ik analyzer 2012 ff...

中文分詞器ikanalyzer 簡單使用

依賴 com.janeluo ikanalyzer 2012 u6 測試 測試ikanalyzer中文分詞器 public class iktest 結果 李 天一 現名 李 冠 豐 著名 歌唱家 李 雙江 和 知名 歌唱家 夢 鴿 之子 根據 司法機關 公布 資料 顯示 李 天一 出生於 1996...

發布IKAnalyzer中文分詞器V3 1 6GA

color red ikanalyzer3.2.0穩定版已經發布,支援lucene3.0和solr1.4 color b size large v3.1.1ga v3.1.5ga 版本變更一覽 size b list 1.新增 正向最大切分演算法 2.完善ik analyzer對solr1.3版本的...