Итак, я пытался использовать кривую Колена, чтобы найти значение оптимального «K» (количество кластеров) в кластеризации K-средних.
Кластеризация была выполнена для средних векторов (используя Word2Vec) текстового столбца в моем наборе данных (1467 строк).Но, глядя на мои текстовые данные, я могу четко найти более 3 групп, в которые можно сгруппировать данные.
Я прочитал, что нужно иметь небольшое значение k при сохранении суммы квадратов ошибок (SSE)низкий.Может кто-нибудь сказать мне, насколько надежна кривая локтя?Также, если что-то мне не хватает.
Прикрепление кривой локтя для справки.Я также попытался построить до 70 кластеров, исследовательских.
.
![enter image description here](https://i.stack.imgur.com/0cagC.png)