Извлечение дочерних кластеров из дендрограммы для построения Wordcloud входного текста в этом кластере - PullRequest
0 голосов
/ 16 марта 2019

Я могу генерировать дендрограмму, используя scipy для ввода текста.
Я пытаюсь извлечь промежуточные кластеры и построить облако слов на основе всех текстовых входов в кластере.

Например, в приведенном ниже примере изображения

enter image description here

Скажем, я хочу построить облако слов для подкластера # 9. Я должен быть в состоянии получить входные индексы 3 и 0 и построить Wordcloud. Если я хочу подняться на один уровень вверх, то есть # 10, теперь он должен построить wordcloud для входных индексов 3, 0 и 7.

Более крупной целью будет создание интерактивного интерфейса, в котором при обходе дендрограммы можно исследовать облако слов. Это уменьшит исследовательские усилия данных, представленных в кластере.

...