Я кластеризую некоторые имена, используя AffinityPropogation от scikit, и я хочу построить / визуализировать кластеры.Мои входные данные имеют предварительно вычисленную близость, и это выглядит так:
#sample input data
joe,mike,ali,andrew,sean
.2,.221,.5,.5,.7
.82,0,.1,.72,.0
.7,.88,.7,.2,1
0,0,.4,.8,.9
.3,.03,.07,.003,.2
А вот простой код, который у меня есть для кластеризации:
import numpy as np
import pandas as pd
import sklearn.cluster
import matplotlib.pyplot as plt
from sklearn import metrics
data = pd.read_csv('/pydata/nametokenmatrix.txt')
M = data.as_matrix()
af = sklearn.cluster.AffinityPropagation(affinity="precomputed", damping=0.5)
af.fit(M)
cluster_centers_indices = af.cluster_centers_indices_
labels = af.labels_
При запуске этого кода,Я генерирую некоторые кластеры, но я не уверен, как построить это так, чтобы я мог их визуализировать.Поскольку я пинаю шины с помощью кластеризации, я хочу сравнить различные алгоритмы, составив их график.Что-то вроде здесь .
Спасибо