Может ли spaCy использовать преимущества графических процессоров для схожести документов? - PullRequest
0 голосов
/ 05 мая 2020

Мы только что столкнулись с множеством проблем с настройкой spacy [cuda] на машине с CentOS 7, потому что мы делаем попарное сходство документов, а это происходило довольно медленно. При выполнении ps код с spacy.require_gpu() по-прежнему использует только около 100% ЦП, без какого-либо заметного прироста по сравнению с обычной установкой spaCy.

Есть ли способ использовать преимущества графического процессора для сходство? Мне нужно найти способ ускорить этот процесс, потому что у меня есть много документов для сравнения.

РЕДАКТИРОВАТЬ

Пока нет ответов , позвольте мне перефокусировать вопрос. Как добиться эффективного попарного сходства в spaCy? С помощью scikit-learn довольно легко определить косинусное сходство, включающее векторы tf-idf, и получить быстрое (хотя, по общему признанию, не такое хорошее) попарное сходство для большого количества текстов. Если мы сможем сделать что-то в этом направлении, тогда будет проще использовать графические процессоры.

...