Question

Я недавно редактировал текстовый файл в кодировке Юникод, который также содержит тайские символы (наряду с «обычными» символами). Почему-то после каждой последовательности тайских символов появлялась новая строка.

После того, как я немного покопался в C, пытаясь удалить все символы новой строки, я запустил vim, чтобы проверить файл. Очевидно, после каждой последовательности символов тайского языка появляется строка «^ M» (без кавычек).

Почему это происходит, и что это за "^ M"? Я обнаружил, что могу решить проблему, удалив последние три символа из тайской строки, но наверняка должен быть более элегантный способ исправить это ...

Mike Cialowicz · Answer 1 · 06 марта 2010

Это не имеет ничего общего с тем, что в файле есть некоторые тайские символы. ^M ('морковь M') - это символ возврата каретки Microsoft (DOS). Dos2unix файл, чтобы избавиться от них перед редактированием в vim.

Проблема кодировки символов

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Проблема кодировки символов

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов