У меня есть данные, включающие два столбца, в которых один категорически показывает состояние функции, а другой численно показывает соответствующее значение.Как показано ниже:
Я хочу запустить алгоритм дерева решений с помощью scikit learn для этих данных.Я не уверен, как обращаться с этими двумя колонками, потому что концептуально я не могу понять, как связать эти очень коррелированные особенности.В принципе, мы не должны оставлять нулевые данные, однако, это должно быть нулевым в числовом столбце по своей природе.Если мы сделаем это "0", это имеет другое значение.
Итак, как мне предварительно обработать эти данные, чтобы алгоритм дерева решений работал правильно?