Python склеарн PCA против TruncatedSVD парализма - PullRequest
0 голосов
/ 16 января 2020

Я выполняю сокращение возможностей для некоторых больших наборов данных как с PCA (полный решатель), так и с TruncatedSVD с пакетом Python (3.6) sklearn. Что я заметил, так это то, что работа PCA была максимально загружена при 6400% загрузки ЦП на большом сервере, который я использую, но TruncatedSVD обычно на 100%. Казалось бы, PCA работает параллельно, а SVD - нет, но ни один из методов не имеет n_jobs в качестве параметра. Нечто подобное было упомянуто на Python Использование нескольких ядер без меня, спрашивающего , но не было никакого определенного объяснения, почему PCA работал параллельно или как его изменить.

Мой вопрос Если PCA из одного и того же пакета работает параллельно, но SVD, по-видимому, не работает, есть ли способ заставить PCA работать в последовательном или SVD-режиме параллельно, чтобы можно было измерить производительность во время выполнения между двумя? Максимальное использование ЦП 6400% кажется слишком круглым числом, чтобы не быть скрытым где-то параметром.

...