У меня есть модель, подогнанная DecisionTreeClassifier (класс DecisionTreeClassificationModel ), и мне нужно проанализировать ее узлы дерева, чтобы визуализировать подмножество или целое дерево, но кажется, что методы доступны вPySpark API очень ограничен.Например - я хотел бы взять узел N и получить его родитель или все листья.Возможно ли это с помощью PySpark API?Пока все, что я могу сделать, это позвонить:
model.toDebugString()
и проанализировать строку, чтобы воссоздать древовидную структуру.
Я видел, что Java API предоставляет больше возможностей,но я не знаю, как использовать его в скрипте PySpark.
В Интернете я также обнаружил, что существует пакет spark-tree-plotting , который даже визуализирует дерево,но у меня возникли некоторые ошибки при попытке установить его (кажется, что он больше не поддерживается).
Буду признателен за любые советы по эффективному анализу дерева решений, возвращаемого моделью.