Будучи моим первым ответом на SO, я не могу понизить ответ Дэниела на регулярное выражение javascript.
Я знаю, что очень поздно, но ответ Даниэля неверен. Это исключает древние символы ниже! Это важно, если вы работаете над приложением Библии, которое исследует слова на древнегреческом языке!
Это правильное регулярное выражение для поиска греческого и коптского в js:
/[\u0370-\u03FF]+/gm
http://unicode.org/charts/PDF/U0370.pdf
Выдержка из таблицы:
0370 L ПИСЬМО ГРЕЧЕСКОГО КАПИТАЛА HETA
→ 2C75 half латинская заглавная буква h
0371 ͱ ГРЕЧЕСКОЕ МАЛЕНЬКОЕ ПИСЬМО ХЕТА
→ 2C76 ⱶ латинская строчная буква h
0372 Ͳ ПИСЬМО ГРЕЧЕСКОГО КАПИТАЛА ARCHAIC SAMPI
0373 ͳ ГРЕЧЕСКОЕ МАЛЕНЬКОЕ ПИСЬМО АРХАИКА SAMPI
РЕДАКТИРОВАТЬ: Крейг указывает, что регулярное выражение Дэниела является правильным для ОП. Хотя я не могу найти, где ОП указывает, какой греческий текст он оценивает, я признаю, что мой ответ действителен только для древних текстов.
В то время как я редактирую это, я также хочу отметить, что никакое регулярное выражение здесь не соответствует греческим символам с акцентом, который Персей добавляет к их текстам. Поэтому, если вам случится установить http://www.perseus.tufts.edu/hopper/, или использовать какой-либо из их ресурсов общественного достояния в приложении, будьте осторожны с моим регулярным выражением.