Я имею дело со строками, которые содержат греческий и английский (латинский) текст. Я хотел бы использовать регулярное выражение, чтобы поймать все греческие слова, которые содержат 4 или более символов на них.
Используя руководство к regexp, я понял, что могу использовать \ p {Greek}, чтобы получить все греческие слова, и \ w {4,}, чтобы получить слова 4+. Тем не менее, эти два не работают вместе из различных тестов, которые я сделал.
Есть ли способ сделать то, что я хочу, используя 1 выражение регулярного выражения? Строки UTF-8 и выходят из твитов.
Привет