Как использовать вложения doc2vec в качестве входа в нейронную сеть - PullRequest
0 голосов
/ 13 декабря 2018

Я пытаюсь постепенно начать работать над системой рекомендаций Twitter в рамках проекта, который требует от меня использования некоторой формы глубокого обучения.Моя цель - рекомендовать другие твиты, основанные на тематическом содержании твита с немаркированными данными.

Я предварительно обработал свои данные и обучил несколько вариантов моделей в doc2vec, чтобы получить как вложения слов, так и вложения документов.Но моя проблема в том, что я чувствую себя немного растерянным из-за того, куда идти отсюда.Я читал, что doc2vec может использоваться как вход в более глубокую нейронную сеть для обучения, такого как LSTM или даже CNN.

Может ли кто-нибудь помочь мне понять, как эти вложения документов (и вложения слов, которые я обучалмодель в режиме DM) используются в качестве входных данных, и какова цель нейронной сети в этом случае, для кластеризации?Я понимаю, что вопрос немного открытый, но я новичок во всем этом, любая помощь будет оценена.

1 Ответ

0 голосов
/ 13 декабря 2018

Если вы обучили d размерный doc2vec для каждого документа, который станет входным вектором для этого конкретного твита.Если у вас есть n количество документов, оно станет n*d размерной матрицей.Теперь эту матрицу можно передать нейронной сети.Все модели LSTM и CNN используются для контролируемых задач обучения (где вы отметили данные).

Если у вас нет помеченных данных, перейдите к обучению без учителя.Кластеризация подпадает под это!Вы можете запустить разные алгоритмы кластеризации и порекомендовать, основываясь на этом.

...