Я обнаружил, что целевое кодирование поезда и набора тестов со средним значением метки должно выполняться на основе целевых значений набора поездов, чтобы мы не пропускали информацию о наборе поездов в тестовый набор.
Я выполняю кодирование цели более Мой набор данных, основанный на метке набора поездов, означает, что, поскольку набор данных является временным рядом, а одна из переменных для кодирования - «Год», последние два года моих данных отправляются в набор тестов и не получают закодированные значения, результаты в NA. Как мы должны кодировать те значения в наборе тестов, которых нет в наборе поездов.