DecisionTreeClassificationModel - как проанализировать и визуализировать дерево решений в PySpark? - PullRequest
0 голосов
/ 12 декабря 2018

У меня есть модель, подогнанная DecisionTreeClassifier (класс DecisionTreeClassificationModel ), и мне нужно проанализировать ее узлы дерева, чтобы визуализировать подмножество или целое дерево, но кажется, что методы доступны вPySpark API очень ограничен.Например - я хотел бы взять узел N и получить его родитель или все листья.Возможно ли это с помощью PySpark API?Пока все, что я могу сделать, это позвонить:

model.toDebugString()

и проанализировать строку, чтобы воссоздать древовидную структуру.

Я видел, что Java API предоставляет больше возможностей,но я не знаю, как использовать его в скрипте PySpark.

В Интернете я также обнаружил, что существует пакет spark-tree-plotting , который даже визуализирует дерево,но у меня возникли некоторые ошибки при попытке установить его (кажется, что он больше не поддерживается).

Буду признателен за любые советы по эффективному анализу дерева решений, возвращаемого моделью.

...