НЕКОТОРЫЙ ФОН
Я работаю над учебным регрессором Random Forest для прогнозирования урожайности сельскохозяйственных культур.Некоторые из моих переменных-предикторов применимы только к некоторым случаям, например, у меня есть переменная, обозначающая количество рядов, которая применяется только к культурам, выращенным в политоннели.Если культуры выращиваются в теплице, количество рядов не применяется, поэтому оно остается нулевым значением.У меня также есть другая переменная, которая обозначает, выращивается ли урожай под политуннелем или теплицей.
ПРОБЛЕМА
Поскольку Случайный Лес не обрабатывает пропущенные значения, есть листратегия, которая может иметь дело со случаями, когда переменные принимают нулевые значения для случаев, когда они не применяются?В учебных пособиях и статьях по этой теме предлагается ввести значения, но в сценариях, которые они считают, эти переменные по-прежнему применяются и отсутствуют из-за какого-то внешнего фактора (например, богатые люди обычно не хотят раскрывать свою зарплату).