Чатбот с word2vec - как начать? - PullRequest
0 голосов
/ 29 апреля 2019

Я сейчас пробираюсь к теме чата. Я уже делал несколько проектов с rasa nlu и chatterbot.

Теперь я хочу сделать следующий шаг и создать его с помощью word2vec или seq2vec. Создайте свой собственный корпус и обучите его с помощью Reddit или Wikipedia.

К сожалению, я не нахожу хороших чтений, учебных пособий в Интернете. Моя цель - создать свой собственный корпус (раздел часто задаваемых вопросов и общая информация о моем университете).

У кого-нибудь есть хорошие чтения по этой теме? И что еще важнее, как лучше построить корпус?

  • Могу ли я просто поместить все свои ответы в CSV?

  • мне нужно сделать вопрос (столбец A) - ответ (столбец B) в CSV

  • можно ли поместить всю информацию в виде непрерывного текста в текстовый файл?

  • Лучше ли это делать так же, как с rasa nlu? с целыми, а затем возможными ответами?

Большое спасибо за все ваши ответы

...