Модель обработки естественного языка - PullRequest
1 голос
/ 30 октября 2011

Я новичок в НЛП и создаю проект для анализа и понимания намерений ввода строк пользователем на английском языке.

Вот что я должен сделать:

  1. Создание текста предложений с POS-тегами и помеченными намерениями для каждого предложения вручную.
  2. Создайте модель, скажем: дерево решений, и обучите ее приведенным выше предложениям.
  3. Попробуйте модель на пользовательский ввод:
  4. Выполните базовые токенизации и POS-теги для предложения ввода пользователя и протестируйте его на приведенной выше модели, чтобы узнать намерения этого предложения.

Все это может быть совершенно неправильно или глупо, но я полон решимости научиться это делать. Я не хочу использовать готовые решения, и язык программирования не имеет значения.

Как бы вы, ребята, выполнили эту задачу? Какую модель выбрать и почему? Как правило, чтобы сделать NLP парсеры, какие шаги сделаны.

Спасибо

1 Ответ

4 голосов
/ 31 октября 2011

Я бы использовал NLTK .Существует электронная книга с главой по тегированию и главой по синтаксическому анализу .Они также предоставляют модели в Python.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...