Как вы токенизируете 1800 цветов? - PullRequest
2 голосов
/ 29 июня 2011

У меня есть поле со значением 1800Flowers.Когда я его индексирую, я хочу, чтобы он был разбит на токены 1, 800, Flowers, 1800Flowers, а затем, в конце концов, на n-грамм.В настоящее время я написал свой собственный фильтрзавод для этого.Однако мне было интересно, сможет ли Solr сделать это с существующими токенизаторами и фильтрами.У кого-нибудь есть лучшее решение для этого?

1 Ответ

1 голос
/ 29 июня 2011

Вы можете попробовать использовать PatternTokenizerFactory .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...