Что это за списки в визуализации дерева склеарн? - PullRequest
0 голосов
/ 19 декабря 2018

Я использую sklearn.tree.export_graphviz для визуализации дерева решений.

https://scikit -learn.org / stable / modules / generate / sklearn.tree.export_graphviz.html

Все узлы имеют эти списки списков в них иЯ не могу на всю жизнь понять, кто они такие и как от них избавиться.Сначала я подумала, что это должны быть образцы.Но все списки имеют одинаковый размер, и образцы не могут быть представлены как списки длины 2.Тогда я подумал, что это будет либо представление имен классов, либо представление нечистоты, но я отключил оба безрезультатно.Я также отключил ID, ярлыки и примеси.Это многоклассовая классификация текста с несколькими метками.

Вот код дерева:

def _create_classifier():
    decision_tree_classifier = DecisionTreeClassifier(
    criterion=CRITERION, # Gini
    splitter=SPLITTER,   # best
    min_samples_split=MIN_SAMPLES_SPLIT, # 4
    #max_features=MAX_FEATURES, # 50%
    max_depth=MAX_DEPTH, # 68
    presort=PRESORT # True
    )
return decision_tree_classifier

Вот поезд и экспорт.Обратите внимание, что все установлено в Ложь:

classifier.fit(X_train, y_train)

from sklearn.tree import export_graphviz
import os

path = 'dtree.dot'

with open(path, 'w') as dotfile:
     export_graphviz(classifier, out_file = dotfile, feature_names=all_features, filled=True, rounded=True, label=False, class_names=False, node_ids=False, impurity=False, proportion=True)
    print("EXPORTED")
os.system('dot -Tpng dtree.dot -o tree.png')

А вот мое дерево:

enter image description here

1 Ответ

0 голосов
/ 19 декабря 2018

Нашел это.Это образцы.Представление представляет собой первые два компонента уменьшения размерности PCA.

https://scikit -learn.org / stable / auto_examples / plot_multilabel.html

...