13.1.1 Standard Analyzer 标准解析器
所谓标准
类型的解析器,指的是那些由 标准分词器 以及 标准标记过滤器 ,小写标记过滤器 和 停顿标记过滤器组成的解析器。
标准
类型的解析器都以下几个配置项:
配置项名称 | 该配置项的作用 |
---|---|
stopwords |
一个停顿符号的列表,用来初始化停顿过滤器。默认情况下这个列表是空的。更多信息在 Stop Analyzer 一文中。 |
max_token_length |
最大的分词量。如果一段话将要被分割成大于最大分词量的子句,那系统只会把它分割成 max_token_length 个子句。该值默认是255 。 |
An analyzer of type standard
is built using the Standard Tokenizer with the Standard Token Filter, Lower Case Token Filter, and Stop Token Filter.
The following are settings that can be set for a standard
analyzer type:
Setting | Description |
---|---|
stopwords |
A list of stopwords to initialize the stop filter with. Defaults to an empty stopword list Check Stop Analyzer for more details. |
max_token_length |
The maximum token length. If a token is seen that exceeds this length then it is split at max_token_length intervals. Defaults to 255 . |