Проблема кодировки символов - PullRequest
1 голос
/ 06 марта 2010

Я недавно редактировал текстовый файл в кодировке Юникод, который также содержит тайские символы (наряду с «обычными» символами). Почему-то после каждой последовательности тайских символов появлялась новая строка.

После того, как я немного покопался в C, пытаясь удалить все символы новой строки, я запустил vim, чтобы проверить файл. Очевидно, после каждой последовательности символов тайского языка появляется строка «^ M» (без кавычек).

Почему это происходит, и что это за "^ M"? Я обнаружил, что могу решить проблему, удалив последние три символа из тайской строки, но наверняка должен быть более элегантный способ исправить это ...

1 Ответ

0 голосов
/ 06 марта 2010

Это не имеет ничего общего с тем, что в файле есть некоторые тайские символы. ^M ('морковь M') - это символ возврата каретки Microsoft (DOS). Dos2unix файл, чтобы избавиться от них перед редактированием в vim.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...