Я прочитал текстовый файл с некоторыми испанскими символами в Postgresql, но обнаружил сообщение об ошибке "недопустимая последовательность байтов для кодировки" UTF8 ": 0Xdc, 0x45,
я использовал следующий код, чтобы получить кодировку дляфайл,
file -bi CAT_CELDAS_20190626.txt
результат:
text/plain; charset=iso-8859-1,
Затем я использую iconv для преобразования кодировки из iso-8859-1 в utf-8,
iconv -f iso-8859-1 -t utf-8 CAT_CELDAS_20190626.txt -o CAT_CELDAS_20190626_new.txt
после преобразования я проверяю кодировку нового файла, это utf-8, но искаженный файл все еще там,
503|706010004403418|3418|3418|13.959919|-89.1149|275|1900|GSM|3418|Hacienda Asunci髇|1|CUSCATLAN|SUCHITOTO|706|1|44|3418|470||
503|706010004403417|3417|3417|13.959919|-89.1149|30|1900|GSM|3417|Hacienda Asunci髇|1|CUSCATLAN|SUCHITOTO|706|1|44|3417|470||