Question

Моя основная задача - каким-то образом локализовать диапазон значений k для выполнения анализа локтя. В настоящее время я могу думать только о диапазоне от 2 до мин. (Num_rows, num_columns). Есть ли какой-либо другой оптимальный метод, который может быть более подходящим, особенно если у вас есть набор данных с чрезвычайно большим количеством строк и столбцов?

PS, также, есть ли способ автоматизировать его, чтобы мы не надо смотреть на локоть-участок? В настоящее время я использую функцию KneeLocator библиотеки Kneed, но я хотел рассмотреть больше вариантов.

Спасибо.

Miguel A. Friginal · Answer 1 · 05 мая 2020

Как известно, не всегда есть «локоть». Даже если он есть, он не обязательно представляет наилучшее количество кластеров.

Функция KneeLocator для Kneed, вероятно, ваш лучший выбор, потому что она находит K с максимальной кривизной.

Есть ли какие-нибудь исследования относительно того, какой будет оптимальный диапазон значений k в методе локтя?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Есть ли какие-нибудь исследования относительно того, какой будет оптимальный диапазон значений k в методе локтя?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы