у меня есть набор данных, где целевая переменная имеет нулевые значения 15%, и я хочу использовать эти пустые строки, как мой набор тестов это возможно? - PullRequest
0 голосов
/ 30 мая 2019

Я использую алгоритм машинного обучения линейной регрессии для прогнозирования значений цены продажи недвижимости и сохраняю цену продажи в качестве целевой переменной. Но цена продажи имеет нулевые значения 15%, поэтому я могу использовать эти 15% в качестве тестаустановить и значения nun-null в качестве моего тренировочного набора?

1 Ответ

0 голосов
/ 31 мая 2019

Да, вы можете сделать это, но поскольку у вас нет реальных значений для этого набора тестов, вы не сможете оценить производительность вашей модели.Там не будет никакой наземной правды, чтобы оценить против.Я бы посоветовал использовать ненулевые данные в 80-10-10 разбивке для проверки поезда и проверки точности.Если эта точность хорошая, то используйте эту модель для прогнозирования нулевых значений, а затем используйте все ненулевые данные для обучения, а затем используйте эту модель для повторного прогнозирования нулевых данных.Затем оцените прогнозы обоих, и вы получите отличную оценку и результаты.

...