Решить проблемы с кодированием документов - PullRequest
4 голосов
/ 25 августа 2011

Я использую solrj 1.4.Мой solrj неправильно индексирует документы в кодировке utf-16.Я предполагаю, что когда он пытается преобразовать в Unicode, он заменяет проблемные суррогатные ключи utf-16 на заменяемый Unicode символ U + FFFD.Кто-нибудь может подсказать мне, как настроить solrj 1.4 для индексирования / поиска документов utf-16, а также utf-8?

1 Ответ

1 голос
/ 25 августа 2011

Индекс Solr указан в utf-8 ( Почему международные символы не работают ).Чтобы иметь возможность выполнять поиск с использованием других кодировок, вы всегда можете выполнить перевод в программном интерфейсе Solr.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...