Использование Kmeans для инициализации EM-алгоритма - PullRequest
2 голосов
/ 03 февраля 2020

Я недавно читал об Максимизации Ожидания (EM), и продолжает появляться, что Инициализация EM с использованием K-Means - хорошая идея, но у меня возникают трудности с пониманием этого понятия.

Так что пока как я знаю при использовании kmeans, в результате вы получаете координаты центроидов кластеров в соответствии с заранее определенным числом кластеров, так как это можно использовать для инициализации EM. Чтобы прояснить ситуацию, это проблема, которую я сейчас пытаюсь решить:

У меня есть набор данных с зашумленными точками данных Y, который исходит из образцов X, взятых из набора 8-ASK. Теперь я загрузил свой набор данных и использовал алгоритм kmeans, чтобы идентифицировать центроиды, но, похоже, не знаю, каков будет следующий шаг. Для EM-алгоритма, который я использую, требуются параметры: начальные начальные значения для центроидов и их распределение вероятностей, а также начальное среднее и дисперсия, но я не понимаю, как их точно получить.

Подводя итог, мой вопрос в основном, как я могу вычислить среднее значение, дисперсию и начальное распределение центроидов, сгенерированных алгоритмом kmeans, когда я запустил его на своих данных Y?

...