Метод гедонистической цены многомерной регрессии в R | Интерпретация линейно-линейной, лог-линейной и лог-логической модели - PullRequest
1 голос
/ 03 июня 2019

Мне известно, что на этом сайте есть похожие вопросы, однако ни один из них, по-видимому, не отвечает на мой вопрос в достаточной мере.

Я выполняю многомерную регрессию для прогнозирования данных о недвижимости с использованием метода цен Гедониста..

ЗАЯВЛЕНИЕ НА ИСПОЛЬЗОВАННЫЕ ДАННЫЕ

Зависимая переменная равна AV_TOTAL , которая фактически является ценой квартирного блока '.

Расстояния от ближайшего парка / шоссе выражаются в метрах.

U_NUM_PARKS / U_FPLACE (наличие парковок и камина) учитываются как фиктивные переменные.

1) Линейно-линейная модель -> Результаты Модель 1

lm(AV_TOTAL ~ LIVINGA_AREAM2 + NUM_FLOORS + 
        U_BASE_FLO + U_BDRMS + factor(U_NUM_PARK) + DIST_PARKS + 
        DIST_HIGHdiff + DIST_BIGDIG, data = data)

Невязки Модель 1

2) Логарифмическая модель -> Модель результатов 2

lm(log(AV_TOTAL) ~ LIVINGA_AREAM2 + NUM_FLOORS + 
        U_BASE_FLO + U_BDRMS + factor(U_NUM_PARK) + DIST_PARKS + DIST_HIGHdiff + DIST_BIGDIG, data = data)

Модель остатков 2

3) Модель журнала -> Модель результатов 3

lm(formula = log(AV_TOTAL) ~ log(LIVINGA_AREAM2) + NUM_FLOORS + 
    U_BASE_FLO + log(U_BDRMS) + factor(U_NUM_PARK) + log(DIST_PARKS) + 
    log(DIST_HIGHdiff) + log(DIST_BIGDIG), data = data)

Остатки Модель 3

Все модели имеют довольно хорошие R ^ 2, а остаточныеГрафик s показывает лучшее нормальное распределение для моделей 2 и 3.

Я не могу понять, какая разница между моделью 2 и 3, особенно в интерпретации переменной DIST_PARKS (расстояние от парков), а также котораяболее правильная модель.

...