Итак, у меня есть этот вектор, и я хочу сгруппировать его с помощью простой кластеризации K-средних, но сначала мне нужно найти оптимальный k-кластер с помощью метода Elbow. Я использую функцию KElbowVisualizer из пакета YellowBrick, чтобы найти оптимальный k-кластер. Проблема в том, что у меня 569 векторов, а график KElbowVisualizer был недостаточно большим для их визуализации; таким образом, я не могу видеть, какой лучший k-кластер существует.
Я искал код для установки размера графика, но он не работал. Вот результат графика:
и вот мой код:
from sklearn.cluster import MiniBatchKMeans
from sklearn.feature_extraction.text import TfidfVectorizer
from yellowbrick.cluster import KElbowVisualizer
vec = TfidfVectorizer(
stop_words = 'english',
use_idf=True
)
vectors_= vec.fit_transform(df1)
model = MiniBatchKMeans()
titleKElbow = "The Optimal K-Cluster with Elbow Method"
visualizer = KElbowVisualizer(model, k=(2,30), metric='silhouette', timings=False, title = titleKElbow, size=(1080, 720))
visualizer.fit(vectors_)
visualizer.show(outpath="G:/My Drive/0. Thesis/Results/kelbow_minibatchkmeans.pdf")
Я даже не смог сохранить его в своем каталоге с последней строкой мой код У кого-нибудь есть идеи, как это исправить? Спасибо