solr搭建企業搜尋平台,配置檔案

2021-06-26 05:06:31 字數 1447 閱讀 1454

原文:

本文的前提條件是,你已經完成了第一節,將solr搭建起來了。

solr版本solr 3.1

solr有幾個配置檔案是最重要的。solr.xml,solrconfig.xml,schema.xml,db-data-config.xml

如果你不使用solr自帶的更新索引的功能,想用solrj程式設計來實現索引更新,那麼我可以告訴你db-data-config.xml檔案沒什麼用,乙個乙個來介紹下這幾個配置檔案吧。

看了網上很多大神的blog,然後自己開發經驗之後發現這些配置檔案都是蠻好理解的。

1.  solr.xml配置例子:

<?xml version="1.0" encoding="utf-8" standalone="yes"?>

< solr sharedlib="lib" persistent="true">

< /solr>

告訴搜尋引擎,db這個資料夾下的配置檔案是可用的配置。

2.solrconfig.xml 配置例子

這個配置檔案的東西就多了。先配置最簡單的乙個也是必須配置的乙個。以後祥談。$

3.db-data-config.xml,即相當於索引對應的資料庫是什麼,資料庫表是什麼。

這個是依你的實際情況來看的。

< /dataconfig> 

4.schema.xml 配置檔案

主要是告訴搜尋引擎建索引的時候哪些字段需要分詞,哪些欄位是什麼型別。使用什麼分詞器,等等

後面專門再寫一下solrconfig和schema.xml的詳細配置。這裡先只談一下他們各自的作用。

solr3.1版本,solr3.x版本大部分應該一致。

乙個乙個的配置項來談談schema.xml 配置:

以下是針對schema.xml 配置檔案的剖析:

1.  這個標籤和它的意義一樣,是用來表示資料有哪些型別,這些型別當然是solr內部定義的型別和自定義型別。

2.   

和他上面解釋一樣,string型別是不分詞的,要建索引,要儲存

3.數值型別,有如下幾個型別是預設數值型別,如果想用於排序請用   tint/tfloat/tlong/tdouble型別

4.時間型別:如果想用於快速排序查詢,用tdate(看到這裡我的排序沒用tdate,得改啊。。)

note: for faster range queries, consider the tdate type

5.專門用於分詞的字段。在裡面包含了定義使用什麼分詞器,可以手工定製。

其他幾個類別都是不常用的,也是通過分詞器來定義不同的類別。和第五個類似。

6.索引欄位名稱定義。

< !--   -->

id:是索引欄位的唯一標識。

multivalued="true"屬性,一般用於多個字段組成乙個欄位的情況。

一般用於查詢的字段定義為multivalued。

7.  表示動態字段,暫時沒用到。

利用solr構建企業搜尋平台 (六)

solr查詢引數說明 在做solr查詢的時候,solr提供了很多引數來擴充套件它自身的強大功能!以下是使用頻率最高的一些引數!具體請看 1.常用 q 查詢字串,必須的。查詢語句 類似sql 相關詳細的操作還需lucene 的query 語法 fl 指定返回那些字段內容,用逗號或空格分隔多個。star...

利用solr構建企業搜尋平台 (十)

四.將solr home目錄下面的solrconfig.xml和schema.xml拷貝到db資料夾下面的conf中。五.修改db conf db data config.xml xml 其中的意思我做簡單解釋,具體大家可以去看看官方wiki。document 乙個文件也就是lucene的docum...

如何搭建企業資料平台

隨著資訊時代正逐步向資料時代轉變,資料演變得越來越重要,它可以反映出公司的經營情況,為公司的經營和決策提供準確的參考依據。而資料平台是連線資料和企業的中介軟體,可以將這些資料通過一定的規格,清晰地展示給企業領導。企業資料平台搭建的整體架構可以由以下幾個部分組成 更深層次的還能收集到使用者的行為資料,...