Случайный лес не предсказывает нули - PullRequest
0 голосов
/ 14 сентября 2018

Я запускаю случайный лес в наборе данных, который содержит много нулей. Эти нули представляют подсчет чего-либо (или его отсутствие) и, следовательно, имеют смысл, в отличие от данных, которые можно классифицировать как «отсутствующие».

Когда я запускаю прогнозы, я обнаруживаю, что мой RF, кажется, не хочет предсказывать ноль, почти как если бы он не рассматривал 0 как число, и вместо этого по умолчанию 1. Есть ли способ, которым я могу решить это? Я просто нахожу странным, что ноль не появляется как прогноз в любое время.

1 Ответ

0 голосов
/ 14 сентября 2018

Это не очень удивительно для меня, но это действительно зависит от вашего набора данных.По сути, выходные данные случайных лесов являются средними значениями обучающих значений (если вы не знаете, как они вычисляются, я предлагаю вам взглянуть на теорию, которая поможет вам понять, как вычисляется случайный лес ...).Таким образом, за исключением случаев, когда ваша цель состоит почти исключительно из нулей или чрезвычайно хорошо определенных шаблонов (например, если определенная особенность принимает какое-то определенное значение (я), тогда целью является всегда 0), представляющей множество обучающих случаев,шансы получить ровно 0 в качестве результата очень низкие.

При этом, если ожидается, что ваш вывод будет целым числом (например, 0), вы можете округлить его.

...