Есть ли способ форсировать извлечение контента с заданной кодировкой - PullRequest
0 голосов
/ 07 ноября 2019

Я использую обработчик запросов / update / extract для отправки документов в solr, но некоторые текстовые документы, закодированные как windows-1255 (арабские тексты), извлекаются неправильно, данный текст не читается.

Я искал в интернете, нашел документацию и ничего не нашел. Мне нужно отправить кодировку файла в качестве параметра, если это возможно, чтобы парсер тика узнал об этом.

Есть ли способ добиться этого?

...