Я могу генерировать дендрограмму, используя scipy для ввода текста.
Я пытаюсь извлечь промежуточные кластеры и построить облако слов на основе всех текстовых входов в кластере.
Например, в приведенном ниже примере изображения
Скажем, я хочу построить облако слов для подкластера # 9. Я должен быть в состоянии получить входные индексы 3 и 0 и построить Wordcloud. Если я хочу подняться на один уровень вверх, то есть # 10, теперь он должен построить wordcloud для входных индексов 3, 0 и 7.
Более крупной целью будет создание интерактивного интерфейса, в котором при обходе дендрограммы можно исследовать облако слов. Это уменьшит исследовательские усилия данных, представленных в кластере.