Я создал дерево классификации и хочу сократить его, используя сокращение стоимости-сложности в пакете rpart. Целевая функция сокращения стоимости - это C (T) = L (T) + a | T |. Для дерева регрессии это будет
C (T) = RSS + a | T | как написано в виньетке rpart.
Но какова целевая функция в дереве классификации?
Я имею в виду, что такое L (T)? Индекс Джини или мера перекрестной энтропии или что-то другое?