sklearn n_jobs! = 1 не распараллеливается в Windows - PullRequest
0 голосов
/ 05 июня 2019

Я пытаюсь воспользоваться опциями распараллеливания, доступными в sklearn, но установка n_jobs! = 1, похоже, не запускает какой-либо параллельный процесс ... Если посмотреть на производительность компьютера, то только 12,5% процессорной мощности используется (у меня Intel Core i7, 4 ядра, 8 потоков; то есть он использует только один поток ...).

Я пробовал использовать разные функции sklearn и импортировать свою функцию (ту, которая использует функцию sklearn) из отдельного модуля, но все так же. Я также нашел много других ответов, но они были специально для Linux, в то время как я использую Windows 10. Кроме того, я попробовал эту функциональность n_jobs в Linux без ошибок, поэтому я предполагаю, что это должно быть что-то среднее между joblib и Windows / Intel, но я понятия не имею, что это может быть ... Я однажды прочитал, что как у joblib возникли некоторые проблемы при работе с виртуальными ядрами Intel в Windows, но я не уверен, есть ли в этом случае решение или нет.

Конкретная строка кода, которую я использую:

labels = MeanShift(bandwidth=25,bin_seeding=True,n_jobs=4).fit_predict(X)

, где X - пустая матрица 6557436x3.

Я полагаю, что при выполнении кода производительность процессора должна составлять 50%, но, как я уже сказал, она составляет всего 12,5% ...

Заранее спасибо!

...