Невозможно сопоставить весь алфавит кириллицы c, используя RegExp - PullRequest
0 голосов
/ 14 апреля 2020

Я пытаюсь вернуть все кириллицы c слова из этого предложения:

"I like to eat healthy food with a little bit of pepper. Cанкт-Петербу́рг э́то оди́н из са́мых краси́вых городо́в Росси́и.Он был осно́ван импера́тором Петро́м I(пе́рвым).Импера́тор реши́л постро́ить го́род здесь, что́бы откры́ть для Росси́и «окно́ в Евро́пу. La Navidad dura dos semanas y las fiestas más importantes son Nochebuena, Navidad, Nochevieja y Reyes. En las casas se pone el tradicional belén, una maqueta con figuras que representa el nacimiento de Jesús, y un gran árbol donde se colocan los regalos";

Я пытался использовать /\p{sc=Cyrillic}\w+/giu, чтобы вернуть все слова кириллицы c, но он возвращает ноль вместо; Затем я попытался /(?<=[\u0400- \u4FF]+\w+)/giu, потому что этот диапазон - алфавит кириллицы c. Я использовал 7 разных сайтов RegExp, но ни один из них не поддерживает класс \ p . Что не так?

1 Ответ

0 голосов
/ 15 апреля 2020

Ваше регулярное выражение не является Unicode, если вы используете \u0400. Поэтому удалите модификатор u.

Класс со всеми разрешенными символами работает вполне нормально, см. https://regex101.com/r/PE4fQT/1

Есть 2 разных C и с.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...