Транслитерация с Iconv в Ruby - PullRequest
       34

Транслитерация с Iconv в Ruby

7 голосов
/ 10 декабря 2010

Когда я пытаюсь транслитеровать строку кириллицы UTF-8 с

Iconv.iconv('ascii//ignore//translit', 'utf-8', string).to_s

(см. вопросы / 1726404 / транслитерация в рубине )

Я получаю все, кроме тех символов, которые нужно транслитерировать.

Например: 'r-строка' & rarr; 'r-' и 'Gévry' & rarr; 'Gvry'.

Что не так?

Ruby 1.8.7 / Rails 2.3.5 / WSeven

Ответы [ 3 ]

2 голосов
/ 25 апреля 2012
require 'iconv'
p Iconv.iconv('ascii//translit//ignore', 'utf-8',  'Gévry') #=> ["Gevry"]
# not         'ascii//ignore//translit'

Для кириллицы может работать транслит .

2 голосов
/ 19 декабря 2010

Кажется, решение слишком сложно для меня. Проблема решена с помощью stringex gem.

1 голос
/ 21 января 2013

Другой способ - создать собственный метод транслита с помощью tr и gsub методов String без использования iconv.

# encoding: UTF-8

def russian_translit(text)
    translited = text.tr('абвгдеёзийклмнопрстуфхэыь', 'abvgdeezijklmnoprstufhey\'')
    translited = translited.tr('АБВГДЕЁЗИЙКЛМНОПРСТУФХЭ', 'ABVGDEEZIJKLMNOPRSTUFHEY\'')

    translited = translited.gsub(/[жцчшщъюяЖЦЧШЩЪЮЯ]/,
        'ж' => 'zh', 'ц' => 'ts', 'ч' => 'ch', 'ш' => 'sh', 'щ' => 'sch', 'ъ' => '', 'ю' => 'ju', 'я' => 'ja',
        'Ж' => 'ZH', 'Ц' => 'TS', 'Ч' => 'CH', 'Ш' => 'SH', 'Щ' => 'SCH', 'Ъ' => '', 'Ю' => 'JU', 'Я' => 'JA')
    return translited
end

p russian_translit("В чащах юга жил бы цитрус? Да, но фальшивый экземпляр!")
#=> "V chaschah juga zhil by tsitrus? Da, no fal'shivyj ekzempljar!"
...