1 回答

TA貢獻1829條經驗 獲得超4個贊
標準分析儀已經將所有內容轉換為小寫字母!
在此處查看文檔:http://lucene.apache.org/core/8_0_0/core/org/apache/lucene/analysis/standard/StandardAnalyzer.html
他們說:
使用可配置的非索引字列表,使用小寫篩選器和停止篩選器篩選標準增強程序。
您還可以在源代碼中看到標準分析器包含哪些組件:
@Override
protected TokenStreamComponents createComponents(final String fieldName) {
final StandardTokenizer src = new StandardTokenizer();
src.setMaxTokenLength(maxTokenLength);
TokenStream tok = new LowerCaseFilter(src);
tok = new StopFilter(tok, stopwords);
return new TokenStreamComponents(r -> {
src.setMaxTokenLength(StandardAnalyzer.this.maxTokenLength);
src.setReader(r);
}, tok);
}
如果您無論如何都要自定義分析器,則應查看 。CustomAnalyzer
添加回答
舉報