Если я добавлю это в начало моего сценария:
$KCODE = 'UTF8'
require 'jcode'
тогда я могу пройтись по каждому символу слова, содержащему символы Юникода. Представьте себе слово, содержащее умлауты или что-то в этом роде, и я перебираю их так:
word.each_char do |c|
# do something with c
end
Если c
- это символ Unicode, и я печатаю его размер, он будет равен 2 (состоит из 2 символов). Как я могу получить код c
? Есть ли какая-нибудь формула, которую я мог бы использовать, или есть что-то в std lib, которая может это сделать?