Способ найти ответы на вопросы путем поиска по заданному набору документов - PullRequest
0 голосов
/ 14 декабря 2011

Как следует из заголовка, мне нужно найти / создать систему, способную извлекать релевантную информацию для запроса путем поиска в наборе данных документов. Из моего собственного исследования я нашел только библиотеки, которые выполняют поиск по индексу, который может указать, какие документы соответствуют запросу, но они не могут извлечь соответствующую информацию. Короче говоря, пользователь задаст вопрос, и система попытается найти ответ на этот вопрос, выполнив поиск в заданном наборе документов.

Может ли кто-нибудь указать мне способ достижения этого или библиотеку, которая может мне помочь?

1 Ответ

0 голосов
/ 14 декабря 2011

Чтобы дать индивидуальный совет вашему варианту использования, эта информация будет полезна:

  • Какой тип документов: темы, стиль написания;
  • какие-нибудь приоритеты для языка программирования или ОС?
  • Должен ли результат просто показать некоторый контекст вокруг найденного текстового отрывка или фразы с правильным ответом на предложение?

Как правило, эта задача требует тегирования и синтаксического анализа текстов. Мне больше нравится нлтк http://www.nltk.org/.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...