Регулярные выражения греческих символов по номеру - PullRequest
1 голос
/ 07 мая 2011

Я имею дело со строками, которые содержат греческий и английский (латинский) текст. Я хотел бы использовать регулярное выражение, чтобы поймать все греческие слова, которые содержат 4 или более символов на них.

Используя руководство к regexp, я понял, что могу использовать \ p {Greek}, чтобы получить все греческие слова, и \ w {4,}, чтобы получить слова 4+. Тем не менее, эти два не работают вместе из различных тестов, которые я сделал.

Есть ли способ сделать то, что я хочу, используя 1 выражение регулярного выражения? Строки UTF-8 и выходят из твитов.

Привет

1 Ответ

3 голосов
/ 07 мая 2011

Используете ли вы модификатор шаблона UTF-8?

/\p{Greek}{4,}/u
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...