Я пытаюсь проверить слова в Ruby 1.8.7.
Мое регулярное выражение, чтобы поймать слово в настоящее время:
/[a-zA-Z]\'*\-*/
Это будет ловить только английские слова; Есть ли способ поймать неанглийские символы UTF-8?
Даже движок 1.8.x Regex поддерживает UTF-8, вам просто нужно использовать правильное выражение, и это немного больше, чем просто /\w/:
/\w/
s = "résumé and some other words" puts s[/[a-z]+/u] puts s[/\w+/u]
и вы получите:
r résumé