Недавно я работал над кластеризацией изображений, которая находила похожие изображения и группировала их вместе.Я использовал модуль Python skimage
для вычисления SSIM, а затем кластеризовал все изображения на основе определенного порогового значения, которое было принято.
Я хочу сделать подобное для текста.Я хочу создать автоматические кластеры, содержащие похожий текст.Например, в кластере-1 может быть весь текст, представляющий работающих матерей, в кластере-2 может быть весь текст, представляющий людей, говорящих о еде и так далее.Я понимаю, что это должно быть обучение без присмотра.У нас есть похожие модули Python, которые могут помочь в решении этой задачи?Я также проверил тензор потока Google, чтобы посмотреть, смогу ли я получить от него что-то, но не нашел ничего, связанного с кластеризацией текста в его документации.