Мне известно, что на этом сайте есть похожие вопросы, однако ни один из них, по-видимому, не отвечает на мой вопрос в достаточной мере.
Я выполняю многомерную регрессию для прогнозирования данных о недвижимости с использованием метода цен Гедониста..
ЗАЯВЛЕНИЕ НА ИСПОЛЬЗОВАННЫЕ ДАННЫЕ
Зависимая переменная равна AV_TOTAL , которая фактически является ценой квартирного блока '.
Расстояния от ближайшего парка / шоссе выражаются в метрах.
U_NUM_PARKS / U_FPLACE (наличие парковок и камина) учитываются как фиктивные переменные.
1) Линейно-линейная модель -> Результаты Модель 1
lm(AV_TOTAL ~ LIVINGA_AREAM2 + NUM_FLOORS +
U_BASE_FLO + U_BDRMS + factor(U_NUM_PARK) + DIST_PARKS +
DIST_HIGHdiff + DIST_BIGDIG, data = data)
Невязки Модель 1
2) Логарифмическая модель -> Модель результатов 2
lm(log(AV_TOTAL) ~ LIVINGA_AREAM2 + NUM_FLOORS +
U_BASE_FLO + U_BDRMS + factor(U_NUM_PARK) + DIST_PARKS + DIST_HIGHdiff + DIST_BIGDIG, data = data)
Модель остатков 2
3) Модель журнала -> Модель результатов 3
lm(formula = log(AV_TOTAL) ~ log(LIVINGA_AREAM2) + NUM_FLOORS +
U_BASE_FLO + log(U_BDRMS) + factor(U_NUM_PARK) + log(DIST_PARKS) +
log(DIST_HIGHdiff) + log(DIST_BIGDIG), data = data)
Остатки Модель 3
Все модели имеют довольно хорошие R ^ 2, а остаточныеГрафик s показывает лучшее нормальное распределение для моделей 2 и 3.
Я не могу понять, какая разница между моделью 2 и 3, особенно в интерпретации переменной DIST_PARKS
(расстояние от парков), а также котораяболее правильная модель.