Я недавно редактировал текстовый файл в кодировке Юникод, который также содержит тайские символы (наряду с «обычными» символами). Почему-то после каждой последовательности тайских символов появлялась новая строка.
После того, как я немного покопался в C, пытаясь удалить все символы новой строки, я запустил vim, чтобы проверить файл. Очевидно, после каждой последовательности символов тайского языка появляется строка «^ M» (без кавычек).
Почему это происходит, и что это за "^ M"? Я обнаружил, что могу решить проблему, удалив последние три символа из тайской строки, но наверняка должен быть более элегантный способ исправить это ...