Мы только что столкнулись с множеством проблем с настройкой spacy [cuda] на машине с CentOS 7, потому что мы делаем попарное сходство документов, а это происходило довольно медленно. При выполнении ps
код с spacy.require_gpu()
по-прежнему использует только около 100% ЦП, без какого-либо заметного прироста по сравнению с обычной установкой spaCy.
Есть ли способ использовать преимущества графического процессора для сходство? Мне нужно найти способ ускорить этот процесс, потому что у меня есть много документов для сравнения.
РЕДАКТИРОВАТЬ
Пока нет ответов , позвольте мне перефокусировать вопрос. Как добиться эффективного попарного сходства в spaCy? С помощью scikit-learn довольно легко определить косинусное сходство, включающее векторы tf-idf, и получить быстрое (хотя, по общему признанию, не такое хорошее) попарное сходство для большого количества текстов. Если мы сможем сделать что-то в этом направлении, тогда будет проще использовать графические процессоры.