如何向nutch索引中新增自己的Field

2021-06-09 22:19:28 字數 843 閱讀 3698

向nutch中新增自己的field也是比較簡單的,和直接呼叫lucene向索引中新增field基本相同,首先設定新增的field是否要被儲存分詞索引,然後將field新增到nutchdocument中,其他的工作就nutch會自動完成:

(1)首先要在indexer的index函式配置執行索引工作前設定新增field的屬性,因為新增的pagetime是用來進行對結果排序使用的,所以它的屬性不能被分詞需要被索引,設定屬性**改動如下:

/**

* 修改方法:根據爬取深度建立索引,depth就是爬取深度

* @param lucenedir

* @param crawldb

* @param linkdb

* @param segments

* @param depth

* @throws ioexception

*/public void index(path lucenedir, path crawldb,

path linkdb, listsegments, int depth)throws ioexception

(2)因為indexermapreduce負責將需要索引的資料新增到nutchdocument中,然後由nutch完成索引建立工作,所以需要在這個地方將我們新增的pagetime屬性新增到nutchdocument文件中,**改動如下:

/*** 先比較dbdatum和fetchdatum中的pagetime的值,選擇最大的作為索引值。

*/long temp=dbdatum.getpagetime();

if(temp

執行程式,在最終的索引檔案中,會看到我們新增的field。

如何向caffe中新增層

修改caffe src caffe proto caffe.proto 在最後新增centerloss層的引數資訊 message centerlossparameter 新增層型別資訊,注意不能與其他層的數字相同。optional centerlossparameter center loss p...

C 中如何向陣列中動態新增元素

背景 現需要向陣列中迴圈插入字串,但c 中的陣列是不支援動態新增元素的,只能建立固定大小的陣列,該如何解決呢?1.string陣列轉list string string strarray new string 也可string strarray list strlist new list strar...

iOS 中如何新增應用自己的字型

1.網上搜尋字型檔案 字尾名為.ttf,或.odf 2.把字型庫匯入到工程的resouce中 3.在程式新增以下 輸出所有字型 nsarray familynames uifont familynames for nsstring familyname in familynames 4.假如你加入的...