Chatbot для использования PDF-документов в качестве источника - PullRequest
1 голос
/ 19 сентября 2019

Я смотрю на создание простого чат-бота, который может использовать файл PDF в качестве источника.Например, входные данные для чат-бота могут быть документом с условиями банка, и чат-бот ответит на вопрос, связанный с содержанием документа.

Пример вопросов и ответов.В: Какова моя ежемесячная плата за мой сберегательный счет?A: Ваша ежемесячная плата за сберегательный счет составляет 5 долларов США, если депозит не превышает 2000 долларов США, в противном случае бесплатно.

Я использовал pdfminer для чтения PDF-документа и преобразования его в обработанные данные, а spaCy для идентификации NER, POS.и т. д.

Я узнал о RASA, и все ссылки, которые я видел, используют определенный текстовый ответ и не используют какой-либо PDF-документ в качестве источника.

Может ли кто-нибудь дать какое-либо руководство относительно того, какой подход я мог быfollow?

Я не хочу использовать Dialogflow или Lex и хочу быть в мире открытого исходного кода.

1 Ответ

0 голосов
/ 19 сентября 2019

То, что вы ищете - это Вопрос-ответ , задача, которая традиционно может быть решена с помощью глубокого обучения.В Rasa вы можете в основном генерировать выходной текст на основе намерений из справочной таблицы.Но чтобы найти ответ, основанный на вопросе, вам потребуется дополнительная обработка.

Если вы ищете вопрос-ответ как услугу, вы можете взглянуть на QnA Maker и посмотреть на эту ветку , в которой также обсуждались другие подходы.

...