Другой способ - взглянуть на существующие инструменты, которые уже выполняют свою работу на основе исследовательских работ: http://nlp.stanford.edu/index.shtml
Я использовал этот инструмент один раз, и это очень приятно. Есть даже онлайн-версия, которая позволяет вам анализировать английский язык и рисовать деревья зависимостей и так далее.
Так что вы можете начать просматривать их документы или сам код.
В любом случае, примите во внимание, что в любой области то, что вы получаете от таких универсальных инструментов, почти всегда не то, что вы хотите. В том смысле, что семантика, приписываемая такими инструментами, не соответствует ожиданиям. В большинстве случаев для конкретного ограниченного домена предпочтительнее использовать собственный синтаксический анализатор и приложить все усилия, чтобы заранее избежать двусмысленности.