Я ищу достойный генератор лексического сканера для C # / .NET - что-то, что поддерживает символьные категории Unicode и генерирует несколько читаемый и эффективный код. Кто-нибудь знает один?
РЕДАКТИРОВАТЬ: I необходимо поддержка категорий Unicode , а не только символы Unicode. В настоящее время в одной только категории Lu
(Letter, Uppercase) содержится 1421 символ, и мне нужно очень точно сопоставить множество различных категорий, и я бы не стал писать от руки наборы символов, необходимые для этого.
Кроме того, фактический код должен - это исключает вещи, которые генерируют двоичный файл, который затем используется с драйвером (т. Е. GOLD)
EDIT: ANTLR пока не поддерживает категории Unicode. Тем не менее, существует открытый выпуск , поэтому он может когда-нибудь соответствовать моим потребностям.