Изменение кодировки на UTF-8 - PullRequest
0 голосов
/ 08 октября 2019

Когда я пытаюсь загрузить CSV через pgAdmin, я получаю эту ошибку: Неверная последовательность байтов для кодировки UTF-8. Как я могу решить это? Исходная кодировка файла должна быть неизвестной - 8 бит. Я уже пробовал использовать iconv, но это не сработало, поэтому я попытался с помощью enca, но я получил эту ошибку: язык 'it' неизвестен или не поддерживается. Как я могу изменить кодировку моего файла на UTF8?

1 Ответ

0 голосов
/ 09 октября 2019

«Это не сработало» не является описанием проблемы, которое выберет уважаемый программист.

Сначала вы должны выяснить кодировку ваших данных. Один инструмент, который поможет вам в Linux: file:

file csvfile

, как правило, дает вам хорошее предположение о кодировке.

Затем преобразуйте его, используя

iconv -f original_encoding -t UTF-8 <csvfile >newfile

Если это не удастся, он скажет вам, какие именно байты были проблематичными. Используя эту информацию, вы получите еще более точное представление о кодировке файла.

Если файл содержит данные в различных кодировках, вам придется исправить это вручную.

...