необходимо: библиотека регулярных выражений C / C ++ с открытым исходным кодом, поддерживающая Юникод - PullRequest
7 голосов
/ 23 февраля 2011

Я ищу хорошую библиотеку регулярных выражений C / C ++ с открытым исходным кодом, которая имеет полную поддержку Unicode.

Я использую это в среде, где библиотека может получить ASCII, UTF-8 или UTF-16. Если он получает UTF-16, он может иметь или не иметь необходимые символы цитирования (FF FE) или (FE FF).

Я посмотрел вокруг, и, кажется, нет никаких вариантов, кроме PCRE.

Моя вторая проблема в том, что в настоящее время я использую flex для создания ОГРОМНЫХ регулярных выражений. В идеале у меня должен быть генератор лексических выражений типа flex, который также обрабатывает Unicode.

Есть предложения?

Ответы [ 2 ]

9 голосов
/ 23 февраля 2011

Рассматривали ли вы ICU ?

Имеет зрелую поддержку регулярных выражений .

0 голосов
/ 23 февраля 2011

Полагаю, Boost Spirit и Boost Regex оба имеют, по крайней мере, некоторую степень поддержки Unicode.

...