Я сейчас пробираюсь к теме чата. Я уже делал несколько проектов с rasa nlu и chatterbot.
Теперь я хочу сделать следующий шаг и создать его с помощью word2vec или seq2vec. Создайте свой собственный корпус и обучите его с помощью Reddit или Wikipedia.
К сожалению, я не нахожу хороших чтений, учебных пособий в Интернете. Моя цель - создать свой собственный корпус (раздел часто задаваемых вопросов и общая информация о моем университете).
У кого-нибудь есть хорошие чтения по этой теме? И что еще важнее, как лучше построить корпус?
Могу ли я просто поместить все свои ответы в CSV?
мне нужно сделать вопрос (столбец A) - ответ (столбец B) в CSV
можно ли поместить всю информацию в виде непрерывного текста в текстовый файл?
Лучше ли это делать так же, как с rasa nlu? с целыми, а затем возможными ответами?
Большое спасибо за все ваши ответы