Question

Я имею дело со строками, которые содержат греческий и английский (латинский) текст. Я хотел бы использовать регулярное выражение, чтобы поймать все греческие слова, которые содержат 4 или более символов на них.

Используя руководство к regexp, я понял, что могу использовать \ p {Greek}, чтобы получить все греческие слова, и \ w {4,}, чтобы получить слова 4+. Тем не менее, эти два не работают вместе из различных тестов, которые я сделал.

Есть ли способ сделать то, что я хочу, используя 1 выражение регулярного выражения? Строки UTF-8 и выходят из твитов.

Привет

cmbuckley · Answer 1 · 07 мая 2011

Используете ли вы модификатор шаблона UTF-8?

/\p{Greek}{4,}/u

Регулярные выражения греческих символов по номеру

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Регулярные выражения греческих символов по номеру

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов