Как обучить миллионы вложений doc2vec с помощью графического процессора? - PullRequest
0 голосов
/ 30 декабря 2018

Я пытаюсь обучить doc2vec на основе истории просмотров пользователей (URL, помеченные как user_id).Я использую цепочку глубокого обучения.

Существует более 20 миллионов (user_id и urls) вложений для инициализации, которые не помещаются во внутреннюю память графического процессора (максимально доступно 12 ГБ).Обучение на процессоре очень медленное.

Я пытаюсь использовать код, написанный на цепочке, приведенной здесь https://github.com/monthly-hack/chainer-doc2vec

Пожалуйста, посоветуйте варианты, если таковые имеются.

1 Ответ

0 голосов
/ 31 декабря 2018

Вы можете также сослаться на официальный пример цепочки word2vec.

Вы уже пробовали тренироваться с GPU?Обычно в память графического процессора извлекаются только данные о размере пакета, поэтому общее количество данных (20 МБ) не влияет на ограничение памяти графического процессора.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...