Экспорт иерархического результата в отдельную таблицу для 3 кластера - PullRequest
0 голосов
/ 28 апреля 2020

Привет, мне интересно, есть ли способ получить результат кластера и экспортировать его в таблицу с кодом python? в моем случае мне нужно преобразовать данные в дендограмму иерархической кластеризации и разделить данные на 3 кластера, а затем экспортировать их в отдельную таблицу (1 таблица на 1 кластер). Ниже приведен код, который я использую:

from sklearn.datasets import load_iris
from sklearn.cluster import AgglomerativeClustering

import numpy as np

from matplotlib import pyplot as plt
from scipy.cluster.hierarchy import dendrogram
def plot_dendrogram(model, **kwargs):
    # Create linkage matrix and then plot the dendrogram

    # create the counts of samples under each node
    counts = np.zeros(model.children_.shape[0])
    n_samples = len(model.labels_)
    for i, merge in enumerate(model.children_):
        current_count = 0
        for child_idx in merge:
            if child_idx < n_samples:
                current_count += 1  # leaf node
            else:
                current_count += counts[child_idx - n_samples]
        counts[i] = current_count

    linkage_matrix = np.column_stack([model.children_, model.distances_,
                                      counts]).astype(float)

    # Plot the corresponding dendrogram
    dendrogram(linkage_matrix, **kwargs)


iris = load_iris()
X = iris.data

# setting distance_threshold=0 ensures we compute the full tree.
model = AgglomerativeClustering(n_clusters=None, distance_threshold=0, linkage='average')

model = model.fit(X)
plt.title('Menggunakan Linkage Average')
# plot the top three levels of the dendrogram
#plot_dendrogram(model, truncate_mode='level', p=3)
plot_dendrogram(model)
plt.xlabel("Number of points in node (or index of point if no parenthesis).")
plt.show()
...