Как использовать регулярное выражение Ruby для захвата неанглийских слов? - PullRequest
3 голосов
/ 05 июня 2011

Я пытаюсь проверить слова в Ruby 1.8.7.

Мое регулярное выражение, чтобы поймать слово в настоящее время:

/[a-zA-Z]\'*\-*/

Это будет ловить только английские слова; Есть ли способ поймать неанглийские символы UTF-8?

1 Ответ

4 голосов
/ 05 июня 2011

Даже движок 1.8.x Regex поддерживает UTF-8, вам просто нужно использовать правильное выражение, и это немного больше, чем просто /\w/:

s = "résumé and some other words"
puts s[/[a-z]+/u]
puts s[/\w+/u]

и вы получите:

r
résumé
...