Используйте iconv
, например, вот так:
iconv -f LATIN1 -t UTF-8 input.txt > output.txt
Дополнительная информация:
Вы можете указать UTF-8//TRANSLIT
вместо простого UTF-8
. Цитировать справочную страницу:
Если строка //TRANSLIT
добавлена к для кодирования , преобразованные символы транслитерируются, когда это необходимо и возможно. Это означает, что когда символ не может быть представлен в целевом наборе символов, он может быть аппроксимирован одним или несколькими похожими символами. Символы, которые находятся за пределами целевого набора символов и не могут быть транслитерированы, заменяются знаком вопроса (?) В выходных данных.
Для получения полного списка кодировок, принятых iconv
, выполните iconv -l
.
- В приведенном выше примере используется перенаправление оболочки. Убедитесь, что вы не используете оболочку, которая исправляет кодировки при перенаправлении - то есть, не используйте PowerShell для этого.