Неконтролируемая кластеризация текста с использованием Tensorflow - PullRequest
0 голосов
/ 30 апреля 2020

Я пытался реализовать модель кластеризации на большом корпусе текстовых данных, используя неконтролируемые алгоритмы обучения, такие как K-Means и BIRCH (Агломерация) с использованием пакетов scikit-learn, но результаты не согласуются для различных данных корпуса.

Затем я переключился на методы глубокого обучения, чтобы создать кластеризацию без контроля на текстовых данных, но не смог найти подходящих API в библиотеке Tensorflow для построения модели NN для кластеров. Архитектуры CNN и Autoencoder имеют механизм извлечения признаков и обучения модели. Однако большая часть доступной документации и ресурсов посвящена обработке изображений.

Существуют ли действительно API-интерфейсы для построения текстовых моделей кластеризации с использованием методов глубокого обучения?

...