Энтропия в пакете fp c R - PullRequest
0 голосов
/ 08 мая 2020

В пакете R fpc функция cluster.stats для внутренних мер проверки принимает только саму кластеризацию, а не какие-либо истинные метки (следовательно, внутренние меры проверки).

Один из выходных данных в возвращаемом списке, по-видимому, $entropy. Это определено в справочнике CRAN как «распределение членства в классе». Но что это на самом деле означает? Как это соотносится с тем, что мы обычно подразумеваем под «энтропией» в этом контексте, которая определяется (как, например, уравнение (186) здесь: https://nlp.stanford.edu/IR-book/html/htmledition/evaluation-of-clustering-1.html) таким образом, что нам потребуется истинное метки, чтобы вычислить его, сделав его таким образом внешней мерой?

...