Я реализую дерево решений, поскольку хочу протестировать различные критерии разделения при работе с несбалансированными данными. Я попытался выяснить, как sklearn
реализует их модуль дерева решений (и, следовательно, их методы, такие как .fit()
и .predict()
) - в основном, как они отслеживают свои узлы.
Я изучил код но я изо всех сил стараюсь следить за тем, чтобы переходить туда-сюда между различными репозиториями, поэтому я надеюсь, что кто-то знает основы c того, как они работают.
В настоящее время я храню их как class Node(left,right)
, где left
и right
оба также Node
, состоящие из данных, разделенных влево / вправо соответственно - но это не работает, как ожидалось