Установите размер сюжета KElbowVisualizer - PullRequest
0 голосов
/ 05 февраля 2020

Итак, у меня есть этот вектор, и я хочу сгруппировать его с помощью простой кластеризации K-средних, но сначала мне нужно найти оптимальный k-кластер с помощью метода Elbow. Я использую функцию KElbowVisualizer из пакета YellowBrick, чтобы найти оптимальный k-кластер. Проблема в том, что у меня 569 векторов, а график KElbowVisualizer был недостаточно большим для их визуализации; таким образом, я не могу видеть, какой лучший k-кластер существует.

Я искал код для установки размера графика, но он не работал. Вот результат графика: enter image description here

и вот мой код:

from sklearn.cluster import MiniBatchKMeans
from sklearn.feature_extraction.text import TfidfVectorizer
from yellowbrick.cluster import KElbowVisualizer

vec = TfidfVectorizer(
      stop_words = 'english',
      use_idf=True
)

vectors_= vec.fit_transform(df1)

model = MiniBatchKMeans()
titleKElbow = "The Optimal K-Cluster with Elbow Method"
visualizer = KElbowVisualizer(model, k=(2,30), metric='silhouette', timings=False, title = titleKElbow, size=(1080, 720))
visualizer.fit(vectors_)
visualizer.show(outpath="G:/My Drive/0. Thesis/Results/kelbow_minibatchkmeans.pdf")

Я даже не смог сохранить его в своем каталоге с последней строкой мой код У кого-нибудь есть идеи, как это исправить? Спасибо

1 Ответ

0 голосов
/ 11 февраля 2020

ответ: просто установите последнюю версию Yellowbrick с pip install -U yellowbrick.

. Не забудьте установить размер графика KElbowVisualizer, чтобы вы могли детально увидеть оптимальный k-кластер

...