13.1.1 Standard Analyzer 标准解析器

所谓标准类型的解析器,指的是那些由 标准分词器 以及 标准标记过滤器小写标记过滤器 和 停顿标记过滤器组成的解析器。

标准类型的解析器都以下几个配置项:

配置项名称 该配置项的作用
stopwords 一个停顿符号的列表,用来初始化停顿过滤器。默认情况下这个列表是空的。更多信息在 Stop Analyzer 一文中。
max_token_length 最大的分词量。如果一段话将要被分割成大于最大分词量的子句,那系统只会把它分割成 max_token_length 个子句。该值默认是255

An analyzer of type standard is built using the Standard Tokenizer with the Standard Token Filter, Lower Case Token Filter, and Stop Token Filter.

The following are settings that can be set for a standard analyzer type:

Setting Description
stopwords A list of stopwords to initialize the stop filter with. Defaults to an empty stopword list Check Stop Analyzer for more details.
max_token_length The maximum token length. If a token is seen that exceeds this length then it is split at max_token_length intervals. Defaults to 255.

results matching ""

    No results matching ""