Какой токенизатор подходит для этого:
input: "This-something is something."
output: ["] [This] [-] [something] [is] [something] [.] ["]
Я пробовал с solr.WordDelimiterFilterFactory
, но это удаляет все специальные символы. Также пробовал solr.KeepWordFilterFactory
, со всеми специальными символами в keepwords.txt
. Но это тоже не работает.
Есть предложения? Я на Solr 3.4.