Я использую нечеткое c средство для классификации некоторых документов. Для документа матрицы терминов, затем примените LSA, и в этой последней усеченной матрице я применяю алгоритм нечетких k средних. В настоящее время матрица членства дает мне нечто подобное ... для k = 3, m = 5, ошибка = 1e-10, iter = 250.
[[0.33333333 0.33333333 0.33333333 0.33333333 0.33333333 0.33333333
0.33333333 0.33333333 0.33333333 0.33333333]
[0.33333333 0.33333333 0.33333333 0.33333333 0.33333333 0.33333333
0.33333333 0.33333333 0.33333333 0.33333333]
[0.33333333 0.33333333 0.33333333 0.33333333 0.33333333 0.33333333
0.33333333 0.33333333 0.33333333 0.33333333]]
Как видите, матрица членства говорит мне что каждый документ имеет равную степень принадлежности к каждому кластеру. И эта ситуация такая же, даже когда я увеличиваю число кластеров до k = 50.
Кто-то может помочь мне понять это и дать мне некоторое представление о том, что я могу сделать.
Спасибо, Мануэла