es elasticsearch的內建分析器

2021-10-17 03:39:07 字數 1663 閱讀 6461

世界上並沒有完美的程式,但是我們並不因此而沮喪,因為寫程式就是乙個不斷追求完美的過程。

es的內建分析器主要有 :

standard

******

whitespace

stop

keyword

pattern

fingerprint

language

下面具體介紹並展示分詞效果 :

# 內建分析器 - standard

# 去除了絕大部分標點符號

# 英文按單詞分割並轉為小寫

# 中文按字分割

post _analyze

# 結果,,

,,,,

,,,,

,,,,

,]}

# 內建分析器 - ******

# 去除所有非字母字元

# 英文按標點與單詞分割並轉為小寫

# 中文按標點分割

post _analyze

# 結果,,

,,,,

,,,,

,,]}

# 內建分析器 - whitespace

# 只按空格分割

# 英文不轉換大小寫

post _analyze

# 結果,,

,,,,

,,,,

]}

# 內建分析器 - stop

# 分詞效果與******類似

# 去除停用詞(預設英文)

post _analyze

# 結果,,

,,,,

,,,,

]}

# 內建分析器 - keyword

# 不分詞,原樣返回

post _analyze

# 結果,]

}

# 內建分析器 - pattern

# 可以自定義pattern :

# 可配置項 :

# pattern

# flags

# lowercase

(預設true

) # stopwords

# stopwords_path

# 預設對所有非單詞(非英文)字元分割 : \\w+

post _analyze

# 結果,,

,,,,

,,,,

,]}

# 自定義分析器

# 內建分析器 - pattern

# 自定義配置,使用下劃線分割

put /test_analyzer}}

}}post /test_analyzer/_analyze

# 結果,,

,,,,

,]}

# 內建分析器 - fingerprint

# 用於輔助聚類

post _analyze

# 結果,]

}

# 內建分析器 - 特定語言的分析器 根據需要自己配置

三 Python內建內建型別效能分析

我們知道,python有列表和字典等資料型別,下面我們就以列表為例,分析對列表操作的一些函式的效能。pop操作測試 1 x range 2000000 2 pop zero timer x.pop 0 from main import x 3print pop zero pop zero.timei...

shell內建命令分析

輸入命令 break 跳出迴圈 builtin 執行shell builtin caller 返回當前子例程呼叫的上下文 cd 改變工作目錄,將目前工作目錄改變到指定的目錄下 command 執行簡單命令或顯示有關命令的資訊 compgen 命令自動補全,根據選項顯示可能的完成情況 complete...

Python內建型別效能分析

python內建型別效能分析 timeit模組 timeit模組可以用來測試一小段python 的執行速度。class timeit.timer stmt pass setup pass timer timer是測量小段 執行速度的類。stmt引數是要測試的 語句 statment setup引數是...