Какую библиотеку я могу использовать для разбора слов в Java? - PullRequest
0 голосов
/ 28 октября 2011

Я пытаюсь найти тип слов, подходящих им по множеству категорий (дата, год, время, имена, знаки препинания, электронная почта и т. Д.).Я делал свой собственный код, чтобы обнаружить это (и работал), но я нашел библиотеки, такие как ANTLR и JavaCC.Если да, что я должен использовать, если нет, я могу что-то использовать для этого?

Какие рекомендации?JavaCC, ANTRL, есть еще?Я вижу, что JavaCC генерирует некоторые классы, но есть вещи, которые мне не нужны, такие как токенизация.

1 Ответ

2 голосов
/ 28 октября 2011

Зависит от того, насколько мощный парсер вам нужен.Если вам нужно что-то очень мощное (например, JavaCC или ANTLR), используйте его и не тратьте слишком много времени, пытаясь создать свое собственное.

Если вам нужно что-то простое, вы можете создать простой синтаксический анализатор поиска по словарю с чуть более регулярными выражениями в Java или, может быть, даже StringTokenizer (если ваш примерочень упрощенно).

...