Почему Random Forest, использующий SAP PAL, предсказывает одно и то же значение для каждого входа? - PullRequest
0 голосов
/ 27 сентября 2018

Я использую библиотеку SAP Predictive Analytics для прогнозирования определенной переменной.Для этого я использую алгоритм Random Decision Tree (также известный как Random Fores).У меня 24 функции и 25 тыс. Строк.Я использую следующие параметры для обучения модели.

INSERT INTO #PAL_PARAMETER_TBL VALUES ('HAS_ID', 1, null, null);
INSERT INTO #PAL_PARAMETER_TBL VALUES ('TREES_NUM', 100, NULL, NULL);
INSERT INTO #PAL_PARAMETER_TBL VALUES ('TRY_NUM', 3, NULL, NULL);
INSERT INTO #PAL_PARAMETER_TBL VALUES ('MAX_DEPTH ', 6, null, NULL);
INSERT INTO #PAL_PARAMETER_TBL VALUES ('SEED', 0, NULL, NULL);
INSERT INTO #PAL_PARAMETER_TBL VALUES ('SPLIT_THRESHOLD', NULL, 1e-5, NULL);
INSERT INTO #PAL_PARAMETER_TBL VALUES ('CALCULATE_OOB', 1, NULL, NULL);
INSERT INTO #PAL_PARAMETER_TBL VALUES ('NODE_SIZE', 500, NULL, NULL);
INSERT INTO #PAL_PARAMETER_TBL VALUES ('THREAD_RATIO', NULL, 1.0, NULL);

Ниже приводится вывод, который я получаю -

Predicted output

Левый столбец - прогнозируемый результат, а правый столбец - достоверность.Предполагается, что действительное значение будет следующим:

Actual value

В моем тренировочном наборе у меня есть значения (для зависимой переменной) в диапазоне от 1,7 до 4Итак, мой вопрос: почему модель ведет себя таким образом?Также я заметил, что используя тот же набор данных для алгоритма дерева решений, я получаю достаточно близкие значения к фактическому результату.Поскольку случайный лес основан на дереве решений, он должен выводить более точные значения!

Пожалуйста, помогите.

ССЫЛКА - Справочное руководство по SAP PAL

...