boost :: regex и класс символов слова (\ W и \ w) - PullRequest
0 голосов
/ 07 мая 2020

Из документации:

«\ W» соответствует любому одиночному символу, который не является членом класса символов «слово»

Похоже, что библиотека boost :: regex по умолчанию предполагает класс символов «слово» как любой символ, даже нелатинский (+ цифры).

Вопрос в том, как установить для библиотеки boost :: regex класс символов "word" как только латинские символы + цифры?

1 Ответ

1 голос
/ 07 мая 2020

Если ICU включил это \w(?<=\p{Block=Basic_Latin})
, если нет, то это \w(?<=[\x{0}-\x{7e}])

...