как распечатать результаты вывода в HDBSCAN - PullRequest
0 голосов
/ 10 апреля 2019

У меня есть данные ASCII, и мне нужно кластеризовать данные, используя HDBSCAN.Я получил метки, но я не знаю, как напечатать результаты выходного кластера, т.е. уникальные и отдельные результаты из hdbscan.

сниппет:

import hdbscan
import numpy as np

datafile = "ascii.txt"

data = np.loadtxt(datafile, dtype = np.uint8)

clusterer = hdbscan.HDBSCAN(min_cluster_size = 20)

clusterer.fit(data)

print (np.unique(clusterer.labels_, return_counts = True))

1 Ответ

0 голосов
/ 18 апреля 2019

Вы можете использовать Pandas, чтобы прочитать файл, а затем распечатать метки кластера вместе с набором данных, который вы используете в качестве входных данных. Попробуйте что-то вроде:

import pandas as pd
df = pd.read_csv("ascii.txt")
clusterer = hdbscan.HDBSCAN().fit_predict(df.ColumnName)
df_pd = pd.DataFrame({'Datapoints:' df.ColumnName, 'Cluster Labels:' clusterer)
...