Показать данные только из одного кластера - PullRequest
0 голосов
/ 13 декабря 2018

У меня есть датафрейм для панд.

input_data = {'col1': [1, 2, 3], 'col2': [3, 4, 5]}
d = pd.DataFrame(data=input_data)

anotherdata= magic(d)
df = pd.DataFrame(data=anotherdata)

Я использую DBSCAN для кластеризации df.В результате у меня есть cluster_labels.В этом случае метки могут иметь значения от -1 (выброс) до 2.

Я хочу иметь возможность показывать только данные отдельного класса отдельно и иметь доступ к исходному фрейму данных d по индексу.

Например, у меня есть элемент с индексом 1 в input_data.Элемент назначен на кластер 0, и нет других элементов кластера 0.

Как найти этот элемент в input_data по индексу?

1 Ответ

0 голосов
/ 16 декабря 2018

Возможно, вы захотите использовать

d[cluster_labels == 0]

Если ваша функция magic не изменила индексы.

...