Неметрическое многомерное масштабирование с использованием sklearn.manifold.MDS с большими данными не возможно? - PullRequest
0 голосов
/ 30 января 2019

Я пытаюсь визуализировать мой многомерный набор данных по двум осям или компонентам, используя неметрическое многомерное масштабирование.Эта функция доступна в библиотеке scikit-learn.Вот мой код:

from sklearn.manifold import MDS 

embedding = MDS (n_components=2, metric= False, n_init=2, max_iter=100, 
                 verbose=0, eps=0.001, n_jobs=2, random_state=101
                ,dissimilarity='euclidean')
#precip=precip[0:100]

precip_transformed = embedding.fit_transform(precip)
precip_transformed

Значения по умолчанию для n_init - 4, max_iter - 300 и n_jobs = None (что означает -1).Это работает вечно, хотя я уменьшил значения по умолчанию и увеличил n_jobs.Это также делает мой ноутбук сбой через некоторое время.Я должен отметить, что мои данные имеют 20000 строк, и когда я сохраняю закомментированную строку кода (всего 100 строк), это работает.Кто-нибудь знает, как я могу сделать эту работу?быстрее или каким-либо способом убедиться, что ноутбук не сломается.

...