Как распознать английские слова через ANTLR? - PullRequest
1 голос
/ 23 августа 2011

Я хотел бы определить, есть ли слово в большом списке ключевых слов (вульгарно и т. Д.), И парсер должен быть хорошим решением (насколько я знаю, это должно быть быстро), потому что мне нужно несколько правил переписать эти слова.

Мой вопрос заключается в том, как добавить в правила грамматики, например (если это возможно):

  • добавьте звездочку после каждой буквы в слове

  • язык языка

  • простые правила, такие как слово + -ing, слово + -ed

(Для этого должен быть учебник, но я не смог его найти.)

Примечание: Эта система будет уведомлять только администраторов, поэтому она не должна быть точной на 100%.

Или вы можете порекомендовать мне другой подход, который был бы лучше?

Спасибо!

1 Ответ

1 голос
/ 25 августа 2011

Для такой задачи, как эта, лучше всего подойдет регулярное выражение или запрос к базе данных.

Грамматика лучше всего подходит для ситуаций, когда у вас есть очень структурированные данные, которые вам нужно либо проверить, либо синтаксически правильно, либо вынужно разобрать в другой структурированный формат.

Поиск слов в корпусе - это больше область регулярных выражений.

...