Есть ли какие-нибудь исследования относительно того, какой будет оптимальный диапазон значений k в методе локтя? - PullRequest
0 голосов
/ 05 мая 2020

Моя основная задача - каким-то образом локализовать диапазон значений k для выполнения анализа локтя. В настоящее время я могу думать только о диапазоне от 2 до мин. (Num_rows, num_columns). Есть ли какой-либо другой оптимальный метод, который может быть более подходящим, особенно если у вас есть набор данных с чрезвычайно большим количеством строк и столбцов?

PS, также, есть ли способ автоматизировать его, чтобы мы не надо смотреть на локоть-участок? В настоящее время я использую функцию KneeLocator библиотеки Kneed, но я хотел рассмотреть больше вариантов.

Спасибо.

1 Ответ

0 голосов
/ 05 мая 2020

Как известно, не всегда есть «локоть». Даже если он есть, он не обязательно представляет наилучшее количество кластеров.

Функция KneeLocator для Kneed, вероятно, ваш лучший выбор, потому что она находит K с максимальной кривизной.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...