Постройте каждый кластер одной точкой (кластеризация Kmeans) - PullRequest
0 голосов
/ 11 июня 2018

Я сгруппировал различные тексты в 15 кластеров.

Тексты в форме:

"Oreo Biscuit is good"
"Healthy Breakfast
"Cars are fast"
....

Я преобразовал тексты в Word2Vec 100 измерений.Теперь у меня есть 15 кластеров, которые я хочу построить.

Вместо того, чтобы строить все точки, я хочу построить 1 точку для каждого кластера, чтобы на графике было 15 точек.Как мне это сделать?

Идеи:

1) Use the cluster centre to plot each cluster.

Is there any other way  (Converting all the Word2vecs in a cluster into 
Doc2vec) or 

Can Mds (Multi Dimensional Scaling) be used to plot the . 
clusters?

Спасибо

1 Ответ

0 голосов
/ 11 июня 2018

У вас уже есть векторное представление каждого текста.У вас также есть кластеры для этих текстов.У вас есть следующие варианты, которые очень просты:

  1. Вы просто строите центриоды кластеров, используя некоторый механизм уменьшения размерности.( Pro : Простой, Минусы: Нет информации о качестве каждого отдельного кластера)
  2. Вы по-прежнему строите центроиды кластера, но эти временные отклонения могут бытьдобавлен в качестве третьего измерения, используя несколько пузырьковых графиков, как показано здесь .( Pro: Включает как среднее, так и дисперсию, Минусы: K-среднее слишком просто)
  3. Мы можем применить некоторые подходы спектральной кластеризации, а затем применить вышеупомянутые методы квершина этого.
...