У меня есть твиты, полученные с помощью API Twitter, и мне нужно сгруппировать твиты по 2 категориям. Для группировки я использовал doc2vec для представления твитов в числовой форме, а затем выполнил кластеризацию алгоритма DBSCAN. Но как узнать, к какой категории относится кластер? Мой вывод - просто твиты, назначенные на разные кластеры.
Например, мне нужно знать, какой твит указывает потребности людей , а какие твиты указывают, что люди могут предложить .
Как узнать, в каком кластере есть твиты?
Спасибо!