Мне нужен механизм регулярных выражений, который поддерживает необработанный UTF-8 - то есть строка UTF-8 хранится в char * как два символа (или один, или меньше) - например, Ab - это массив {0x41,0x62 }.
Кто-нибудь знает о движке регулярных выражений, который может получить этот формат?
Я могу сначала преобразовать в wchar_t, если это необходимо.