K- означает кластеризацию для вектора слов (размерность 300) - PullRequest
0 голосов
/ 18 июня 2020

Я пишу программу, для которой мне нужно применить кластеризацию K-средних по набору данных из некоторых массивов из> 200, 300 элементов. Может ли кто-нибудь предоставить мне ссылку на код с пояснениями по: 1. поиск k через метод локтя 2. применение метода k означает и получение массивов для центроидов

Я искал вышеуказанное на моем владеют, но не нашли ни одного с четкими объяснениями кода. Ps Я работаю над Google Colab, поэтому, если есть определенные c методы для того же, предлагаю


Я пробовал код ниже, однако я продолжаю получать следующую ошибку -

---------------------------------------------------------------------------

TypeError                                 Traceback (most recent call last)

TypeError: float() argument must be a string or a number, not 'list'


The above exception was the direct cause of the following exception:

ValueError                                Traceback (most recent call last)

<ipython-input-70-68e300fd4bf8> in <module>()
     24 
     25 # step 1: find optimal k (number of clusters)
---> 26 find_best_k()
     27 

3 frames

/usr/local/lib/python3.6/dist-packages/numpy/core/_asarray.py in asarray(a, dtype, order)
     83 
     84     """
---> 85     return array(a, dtype, copy=False, order=order)
     86 
     87 

ValueError: setting an array element with a sequence.

1 Ответ

1 голос
/ 18 июня 2020
• 1000 *

Диаграмма изгиба:

enter image description here

Результаты:

enter image description here

Надеюсь, это поможет.

...