Работа с файлом UTF-8 в Ruby - PullRequest
       12

Работа с файлом UTF-8 в Ruby

0 голосов
/ 31 августа 2011

8 богов и богинь,

У меня есть CSV-файл, по слухам, для кодирования в Win UTF-8.Мне нужно применить к нему кучу reg exps и другие виды манипуляций со строками / массивами, а затем снова вывести их в WIN UTF-8.Я использую Ruby 1.8 на Mac Lion.Есть ли какие-то ошибки, о которых я должен знать?У меня нет фу UTF-8.

Хорошо, так что победа utf-8 потрясла всех остальных, как и меня.А как насчет UTF-8?кто-нибудь?кто-нибудь?

Заранее спасибо Марк

1 Ответ

0 голосов
/ 31 августа 2011

Я не совсем уверен, в чем ваша проблема.

В Ruby 1.8 есть встроенная поддержка UTF-8.На самом деле это единственный формат, с которым он может работать внутри.В противном случае вы всегда можете использовать iconv для преобразования между кодировками.Если формат отличается от UTF-8, вы должны использовать iconv для ввода и вывода.

Перезапуская CSV, я думаю, что quickcsv - это действительно полезная структура для этого, поскольку она охватывает все угловые случаи и позволяетдля настройки формата ввода / вывода.

В зависимости от того, сколько из этих файлов вы должны отредактировать, может быть быстрее использовать простой текстовый редактор для преобразования вашего файла в стандартный UTF-8 с окончаниями в стиле Unix.Затем вы можете применить свои изменения и преобразовать их обратно в редакторе.

...