Согласно математической формуле для оценки согласованности u_mass, приведенной в исходной статье .
Если u_mass ближе к значению 0 означает идеальную согласованность и колеблется в любую сторону от значения 0, зависит от количество выбранных тем и тип данных, используемых для выполнения кластеризации topi c. Лучший способ оценить u_mass - построить кривую между u_mass и различными значениями K (количество тем). Выберите K со значением u_mass, близким к 0.
Вы можете обратиться к этой ссылке , которая предоставляет python фрагмент кода для построения кривой между различными значениями K и c_v. Здесь вы можете заменить c_v на u_mass coherence metri c.
Надеюсь, это объяснение поможет.