Перекрывающиеся узлы в CHAID (дереве решений) в SPSS Modeler - PullRequest
1 голос
/ 07 мая 2019

Я иногда сталкиваюсь с узлами в моделях CHAID (в SPSS Modeler), которые, кажется, имеют перекрывающиеся значения, такие как:

enter image description here

Выше разделение происходит по непрерывной переменной («Выполнение в: Работа над заданием ...» и т. Д. Основано на элементе в масштабе Лайкерта). Мне неясно, как интерпретировать узлы - например, Узел 4 <= 5.000, но Узел 5 - 5.000.6.000. Я заметил, что есть скобки, но не знаю, что они представляют. </p>

Или это потому, что я неправильно настроил параметры сборки? В настоящее время они установлены на:

  • Сборка новой модели
  • Построить одно дерево (Создать модель)
  • Исчерпывающая ЦЕПЬ
  • Максимальная глубина дерева установлена ​​в пользовательское значение: 10
  • Правила остановки по умолчанию (проценты), правила ансамбля по умолчанию и все дополнительные параметры также являются значениями по умолчанию

Заранее спасибо за любые рекомендации.

1 Ответ

2 голосов
/ 08 мая 2019

Нет никаких совпадений.SPSS использует те же обозначения для диапазонов значений (так называемые «интервалы»), которые вы можете найти в курсе исчисления.Скругленные круглые скобки указывают, что интервал не включает конечную точку, а квадратные скобки указывают, что конечная точка находится в пределах интервала.

Итак, средний узел дерева помечен как «(6, 7]», но,поскольку значения переменных являются целыми числами, на самом деле в этот узел попадают только случаи со значением 7. Для элемента с масштабированием по Лайкерту, такого как этот, вы можете указать SPSS обрабатывать переменную как порядковый, а не как непрерывный.

...