В пакете R fpc
функция cluster.stats
для внутренних мер проверки принимает только саму кластеризацию, а не какие-либо истинные метки (следовательно, внутренние меры проверки).
Один из выходных данных в возвращаемом списке, по-видимому, $entropy
. Это определено в справочнике CRAN как «распределение членства в классе». Но что это на самом деле означает? Как это соотносится с тем, что мы обычно подразумеваем под «энтропией» в этом контексте, которая определяется (как, например, уравнение (186) здесь: https://nlp.stanford.edu/IR-book/html/htmledition/evaluation-of-clustering-1.html) таким образом, что нам потребуется истинное метки, чтобы вычислить его, сделав его таким образом внешней мерой?