Когда вы говорите «выглядит так», вы просматриваете это значение IRB? Он будет избегать символов диапазона, отличных от ASCII, с экранированием байтовых последовательностей, которые представляют символы в стиле C.
Если вы печатаете их с путами, вы получите их обратно, как и ожидаете, предполагая, что ваша консоль оболочки использует ту же кодировку, что и рассматриваемая строка (очевидно, в данном случае UTF-8, основываясь на двух байтах, возвращаемых для этот персонаж). Если вы сохраняете значения в текстовом файле, печать на дескриптор также должна приводить к последовательностям UTF-8.
Если вам необходимо выполнить перевод между UTF-8 и другими кодировками, особенности зависят от того, используете ли вы Ruby 1.9 или 1.8.6.
Для 1,9: http://blog.grayproductions.net/articles/ruby_19s_string
для 1.8 вам, вероятно, нужно взглянуть на Iconv.
Кроме того, если вам нужно взаимодействовать с COM-компонентами в Windows, вам нужно указать ruby использовать правильную кодировку, например:
require 'win32ole'
WIN32OLE.codepage = WIN32OLE::CP_UTF8
Если вы взаимодействуете с mysql, вам нужно установить в таблице параметры сортировки, которые поддерживают кодировку, с которой вы работаете. В общем случае лучше установить сопоставление в UTF-8, даже если часть вашего контента возвращается в других кодировках; вам просто нужно конвертировать по мере необходимости.
У Нокогири есть некоторые особенности для работы с различными кодировками (вероятно, через Iconv), но я немного не практикую в этом, поэтому я оставлю объяснение этому кому-то еще.