es-analysis模块学习总结

发布时间 2023-06-17 16:05:31作者: 爵士灬

什么是 Analysis

顾名思义,文本分析就是把全文本转换成一系列单词(term/token)的过程,也叫分词。在 ES 中,Analysis 是通过分词器(Analyzer) 来实现的,可使用 ES 内置的分析器或者按需定制化分析器。

举一个分词简单的例子:比如你输入 Mastering Elasticsearch,会自动帮你分成两个单词,一个是 mastering,另一个是 elasticsearch,可以看出单词也被转化成了小写的。

analysis模块也是es索引的关键模块,在索引和检索的过程中都会使用到这个模块,尤其是需要根据业务场景自定义的情形

 

 

 

PUT /my_index
{
    "settings": {
        "analysis": {
            "char_filter": { ... 字符过滤器 ... },
            "tokenizer":   { ...   分词器    ... },
            "filter":      { ...   词单元过滤器   ... },
            "analyzer":    { ...   分析器      ... }
        }
    }
}