Рассмотрим вентиль XOR с тремя входами. Таблица истинности будет: Таблица истинности входных данных XOR *
Теперь все переменные сами по себе являются почти случайными, насколько это касается модели. Каждый вход 1 или 0 имеет 50% шанс быть классифицированным как 1 или 0. Если мы пытаемся использовать Случайный Лес, чтобы вывести отношения переменных, которые сами по себе не должны определять выход, насколько полезной является важность функции? И какой из методов важности признаков с большей вероятностью предоставит точное описание результата?
Кроме того, используя XOR в качестве ориентира, какова связь с точки зрения данных, необходимых для случайного леса для создания точной модели для n функций.