Деревья решений на самом деле очень легко предоставить данные, потому что все, что им нужно, это таблица данных и какой столбец из этих данных, какую функцию (или столбец) вы хотите прогнозировать. Эти данные могут быть дискретными или непрерывными для любой функции. Теперь существует несколько разновидностей деревьев решений с различной поддержкой непрерывных и дискретных значений. И они работают по-разному, поэтому понимание того, как работает каждый, может быть проблематичным.
Различные алгоритмы дерева решений со сравнением сложности или производительности
В зависимости от типа интересующего вас алгоритма может быть сложно найти информацию, не читая реальные статьи, если вы хотите попробовать и реализовать ее. Я реализовал алгоритм CART, и единственной возможностью для этого было найти оригинальную книгу на 200 страниц. В большинстве других процедур обсуждаются только такие идеи, как разделение, с достаточной детализацией, но не обсуждается какой-либо другой аспект на более высоком уровне.
Как будто они принимают во внимание зависимости между вещами. Я полагаю, что это предполагает только зависимость между каждой входной функцией и функцией прогнозирования. Если входные данные не зависят от функции прогнозирования, вы не сможете использовать ее в качестве критерия разделения. Но между другими функциями ввода я считаю, что они должны быть независимы друг от друга. Я должен был проверить книгу, чтобы убедиться, что это правда или нет, но мне кажется, что это правда.