Я использую общедоступный набор данных, доступный по этой ссылке.
Речь идет о маркетинге, и одна из переменных (pdays
, числовая) относится к числу дней, прошедших после того, как клиент былпоследний контакт из предыдущей кампании.
Строки, значение которых равно 999, означает, что с клиентом ранее не связывались. Я боюсь, что использование этого в алгоритме ML приведет к неверным результатам.
Я думаю об их обнулении. Но я не знаю, что делать с нулями при масштабировании набора данных перед использованием алгоритма (следует ли учитывать нули?).
Есть ли лучшее решение?