Стандартным способом было бы скопировать источник и создать свой собственный.
Стемминг - это эвристический процесс, основанный на правилах.Он предназначен для создания основ, которые хотя и несовершенны, но обычно достаточно хороши для облегчения поиска.В нем нет словаря сопряженных слов и их основ для изменения.-uto - один из суффиксов глаголов, удаленных из слов итальянским родословным снежного кома , как описано здесь .Вы можете создать свою собственную версию, удалив этот суффикс из списка, но, вероятно, вы создадите больше проблем, чем решаете, все сказали.
Инструмент, который возвращает правильное корневое слово, обычно называется lemmatizer , и я не верю, что кто-то придет с Lucene, из коробки.Морфологический анализ, как правило, медленнее и сложнее.Если это важно для вашего варианта использования, вы можете найти итальянский лемматизатор и использовать его в пользовательском фильтре или предварительно обработать текст, прежде чем передать его в анализатор.