sklearn min_impurity_decrease Объяснение - PullRequest
0 голосов
/ 21 февраля 2019

Определение min_impurity_decrease в sklearn:

Узел будет разделен, если это разделение вызовет уменьшение примеси, большее или равное этому значению.

Используя набор данных Iris и поместив min_impurity_decrease = 0.0

Как выглядит дерево, когда min_impurity_decrease = 0.0

Помещая min_impurity_decrease = 0.1, мы получим это:

Как выглядит дерево, когда min_impurity_decrease = 0,1

Глядя на зеленый квадрат, где индекс Джини (примесь) = 0,2041, почему оно не раскололось, когда мы положили min_impurity_decrease = 0,1, хотяиндекс Джини (примесь) left = 0.0 и индекс Джини (примесь) right = 0.375

Означает ли это, что нужно обрезать все дочерние узлы, где при сокращении индекс Джини их родительских узлов станет меньше 0,1?Потому что, если это так, то почему мы не сократили узел второго уровня, имеющий gini = 0,487), что больше 0,1?

...