Я недавно читал об Максимизации Ожидания (EM), и продолжает появляться, что Инициализация EM с использованием K-Means - хорошая идея, но у меня возникают трудности с пониманием этого понятия.
Так что пока как я знаю при использовании kmeans, в результате вы получаете координаты центроидов кластеров в соответствии с заранее определенным числом кластеров, так как это можно использовать для инициализации EM. Чтобы прояснить ситуацию, это проблема, которую я сейчас пытаюсь решить:
У меня есть набор данных с зашумленными точками данных Y, который исходит из образцов X, взятых из набора 8-ASK. Теперь я загрузил свой набор данных и использовал алгоритм kmeans, чтобы идентифицировать центроиды, но, похоже, не знаю, каков будет следующий шаг. Для EM-алгоритма, который я использую, требуются параметры: начальные начальные значения для центроидов и их распределение вероятностей, а также начальное среднее и дисперсия, но я не понимаю, как их точно получить.
Подводя итог, мой вопрос в основном, как я могу вычислить среднее значение, дисперсию и начальное распределение центроидов, сгенерированных алгоритмом kmeans, когда я запустил его на своих данных Y?