Мне нужно написать токенайзер для файлов с исходным кодом в Solr, но у меня нет возможности включения пользовательских JAR-файлов.Например:
Ввод: foo.bar
Токены: 'foo', '.', 'bar'
Как я могу иметь собственный токенизатор или фильтр в schema.xml, который может делиться на некоторыесимволы, но также не удалить символ?
Я пробовал токенайзер шаблонов Regex, но он удаляет разделители.