Сплит Юникод Строка с Рубином - PullRequest
2 голосов
/ 25 октября 2009

Как я могу разделить строку по диапазону Unicode в Ruby. Я хотел разделить под \ u1000 и более \ u1000 с запятой. Например, я хотел разбить эту строку ...

Я люблю ျ မန္ မာ

к этому ...

Я люблю, ျ မန္ မာ

Вы не можете видеть символы Юникода в моем примере. Это диапазон Юникода \ u1000 и выше.

Спасибо.

1 Ответ

2 голосов
/ 25 октября 2009

Зависит от того, какую версию вы используете; вот решение для 1.9. Я полагаю, что 1.8 может стать ужасной.

Это падает на элегантность, но, кажется, работает.

"I love ျမန္မာ".gsub(/([\u0000-\u0999])([\u1000-\u9999])/, '\1,\2')

Если этот метод подходит, вам придется предоставить другой случай (переход от высокого к низкому)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...