Невозможно преобразовать следующий файл: «udhr_deu_1901.txt» (источник: https://unicode.org/udhr/d/udhr_deu_1901.txt) с командой «iconv» в cygwin - PullRequest
0 голосов
/ 08 ноября 2018

Я хочу конвертировать файл

"udhr_deu_1901.txt" from UTF-8 to ISO-8859-1. 

Сообщение, которое я получаю от терминала:

     "iconv: udhr_deu_1901.txt:2:7: cannot convert".

Я не знаю, что делать дальше. Как преобразовать файл .txt в ISO-8859-1?

1 Ответ

0 голосов
/ 08 ноября 2018

Файл содержит некоторые символы, которые iconv не удается перевести.

Мы можем преобразовать пропуск непереводимого символа и преобразовать обратно в UTF8. чтобы проверить, какой символ нам не хватает:

$ iconv -f UTF8 -t ISO-8859-1 -c udhr_deu_1901.txt > udhr_deu_1901-8859-1.txt

$ iconv -t UTF8 -f ISO-8859-1  udhr_deu_1901-8859-1.txt > udhr_deu_1901-UTF8.txt

$ diff -uN udhr_deu_1901.txt udhr_deu_1901-UTF8.txt
--- udhr_deu_1901.txt   2017-12-14 15:35:09.000000000 +0100
+++ udhr_deu_1901-UTF8.txt      2018-11-08 18:29:18.070810900 +0100
@@ -1,6 +1,6 @@
 Universal Declaration of Human Rights - German, Standard (1901)
-© 1996 – 2009 The Office of the High Commissioner for Human Rights
-This plain text version prepared by the “UDHR in Unicode”
+© 1996  2009 The Office of the High Commissioner for Human Rights
+This plain text version prepared by the UDHR in Unicode
 project, https://www.unicode.org/udhr.
 ---

Итак, проблема в -, и , которую, я полагаю, вы можете добавить вручную

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...