Реализация Lucene без анализатора для используемого языка контента? - PullRequest
3 голосов
/ 06 января 2011

Имеет ли это смысл?

Для моего клиента слишком дорого разрабатывать Анализатор для хорватского языка, я не нашел ни одного из существующих ... поэтому мой вопрос ... могу ли я сказать имотбросить идею Lucene для хорватского контента?

Спасибо!

Ответы [ 2 ]

2 голосов
/ 06 января 2011

Морфологический анализатор Sematext утверждает, что поддерживает хорватский язык.

1 голос
/ 06 января 2011

Роберт Мьюр, Крис Мале и другие создали морфологический анализатор Lucene на основе Hunspell . Код здесь . Хорватский является одним из поддерживаемых языков в списке. Я думаю, что могут возникнуть проблемы с лицензированием, поскольку hunspell - это GPL, но это стоит проверить.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...