Как построить аффинный кластер с помощью scikit - PullRequest
0 голосов
/ 16 октября 2018

Я кластеризую некоторые имена, используя AffinityPropogation от scikit, и я хочу построить / визуализировать кластеры.Мои входные данные имеют предварительно вычисленную близость, и это выглядит так:

#sample input data
joe,mike,ali,andrew,sean
.2,.221,.5,.5,.7
.82,0,.1,.72,.0
.7,.88,.7,.2,1
0,0,.4,.8,.9
.3,.03,.07,.003,.2

А вот простой код, который у меня есть для кластеризации:

import numpy as np
import pandas as pd
import sklearn.cluster
import matplotlib.pyplot as plt
from sklearn import metrics

data = pd.read_csv('/pydata/nametokenmatrix.txt')

M = data.as_matrix()
af = sklearn.cluster.AffinityPropagation(affinity="precomputed", damping=0.5)
af.fit(M)

cluster_centers_indices = af.cluster_centers_indices_
labels = af.labels_

При запуске этого кода,Я генерирую некоторые кластеры, но я не уверен, как построить это так, чтобы я мог их визуализировать.Поскольку я пинаю шины с помощью кластеризации, я хочу сравнить различные алгоритмы, составив их график.Что-то вроде здесь .

Спасибо

1 Ответ

0 голосов
/ 25 октября 2018

Вам нужно будет встроить свою аффинную матрицу.

Тщательно адаптированный неметрический MDS должен быть хорошим началом.

...