Я пытаюсь постепенно начать работать над системой рекомендаций Twitter в рамках проекта, который требует от меня использования некоторой формы глубокого обучения.Моя цель - рекомендовать другие твиты, основанные на тематическом содержании твита с немаркированными данными.
Я предварительно обработал свои данные и обучил несколько вариантов моделей в doc2vec, чтобы получить как вложения слов, так и вложения документов.Но моя проблема в том, что я чувствую себя немного растерянным из-за того, куда идти отсюда.Я читал, что doc2vec может использоваться как вход в более глубокую нейронную сеть для обучения, такого как LSTM или даже CNN.
Может ли кто-нибудь помочь мне понять, как эти вложения документов (и вложения слов, которые я обучалмодель в режиме DM) используются в качестве входных данных, и какова цель нейронной сети в этом случае, для кластеризации?Я понимаю, что вопрос немного открытый, но я новичок во всем этом, любая помощь будет оценена.