Для алгоритмов кластеризации в sklearn, есть ли способ указать, сколько кластеров вы хотите, чтобы алгоритм нашел (вместо того, чтобы алгоритм нашел свое количество кластеров)? Исходя из моих введенных данных, я надеюсь на 2 кластера вместо 3, которые он выводит для меня.
Если это поможет, я использую алгоритм MeanShift (но мой вопрос относится ко всем из них). Кроме того, большинство уроков, кажется, используют make_blobs, но я использую read_csv от pandas вместо того, чтобы загружать мои данные, если это что-то меняет.
Это начальная часть моего кода:
df = pd.read_csv(filename, header = 0)
original_headers = list(df.columns.values)
df = df._get_numeric_data()
data = df.values
ms = MeanShift()
ms.fit(data)
labels = ms.labels_
cluster_centers = ms.cluster_centers_
n_clusters_ = len(np.unique(labels))
print("Number of estimated clusters:", n_clusters_)