LingPipe, вероятно, стоит рассматривать как полноценный инструмент НЛП.
Однако, если все, что вам нужно, это найти глаголы и существительные и поставить их в основу, тогда вы можете просто 1) разбить текст на части 2) запустить POStagger 3) запустить стемер
Инструменты Стэнфорда могут сделать это для нескольких языков, я верю, и NLTK будет быстрым способом опробовать это.
Однако вы должны быть осторожны спросто после глаголов и существительных - что вы делаете с существительными и многословными существительными?В идеале пакет nlp может справиться с этим, но многое зависит от домена, в котором вы работаете. К сожалению, многие NLP определяют, насколько хороши ваши данные.