Как express неперекрывающихся диапазонов непрерывной переменной в качестве переменной отклика для моего дерева решений прогнозирующей модели? - PullRequest
0 голосов
/ 17 апреля 2020

Я пытаюсь построить дерево решений для прогнозирования диапазона доходности на следующий день по некоторым данным фондового рынка. Реализация метода CART осуществляется с помощью функции Scikit-learn "DecisionTreeClassifier". Я понимаю, что return - это непрерывная переменная, поэтому можно использовать дерево регрессии, но я хочу, чтобы целевой переменной был диапазон возврата на следующий день, выраженный как один из 21 возможных непересекающихся интервалов возврата:

отрицательные интервалы возврата: (−100%, −11.00%), (−11.00%, −9.00%), (−9.00%, −7.00%), (−7.00%, −5.00%), (- 5,00%, -3,00%), (-3,00%, -1,00%), (-1,00%, -0,80%), (-0,80%, -0,60%), (-0,60%, -0,40%) и ( -0,40%, -0,20%)

положительные интервалы возврата: (0,20%, 0,40%), (0,40%, 0,60%), (0,60%, 0,80%), (0,80 %, 1,00%), (1,00%, 3,00%), (3,00%, 5,00%), (5,00%, 7,00%), (7,00%, 9,00%), (9,00%, 11,00%) и (11,00% , ∞)

Я бы обозначил их как y E {-10. -9, ... 0 ... 9, 10) где «нейтральный» диапазон возврата (-0.20%, 0,20%) помечен как диапазон «0».

Я просто не знаю, как go о кодировании этого с помощью Ski-Kit Learn и буду признателен за любые рекомендации.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...