У меня есть набор документов, все из которых подпадают под категорию «преступление».
Теперь я хочу разделить их на несколько (могут перекрываться) кластеров документов, где каждый из кластеров сформирован под подкатегорией, такой как убийство или похищение людей и т. Д.
Я хочу сделать это, используянекоторый способ определения важности отдельных слов, встречающихся в каждом документе.Я уже пробовал использовать TF-IDF, но он не дает удовлетворительных результатов.