Полу-контролируемая кластеризация / классификация - PullRequest
0 голосов
/ 07 декабря 2018

У меня есть данные от датчиков, и я хочу запустить кластерный алгоритм на этих данных.Данные не содержат информации о метках кластера, но я могу добавить некоторые метки вручную.

Как использовать метки, добавленные вручную, чтобы помочь обучению без учителя?

Один небольшой пример - используйте измерения с метками в качестве начальных центров для k-средних.Какой алгоритм на основе плотности я могу использовать для этих данных?

1 Ответ

0 голосов
/ 07 декабря 2018

Вы можете выбрать, какие сэмплы будут исходными центрами для k-средних, используя аргумент init (см. Документ здесь ).

Если ndarray передан init, он должениметь форму (n_clusters, n_features) и дает начальные центры.В этом случае будет выполняться одна инициализация с использованием центроидов, указанных в массиве , как описано здесь .

Эта требуемая форма означает, что init должен иметь ровно n_clusters строк, а количество элементов вкаждая строка должна соответствовать размерности actual_data_points , как обсуждено здесь .

...