Почему две модели lm log с разными базами дают одинаковые прогнозы? - PullRequest
0 голосов
/ 13 мая 2019

Я пытаюсь предсказать значения, используя функции lm () и pregnet (), и две разные функции дают одинаковые значения

рассмотрим data.frame

d <- structure(list(sample_number = 1:9, 
                    cumSum = c(200.903, 296.329, 370.018, 431.59, 485.14, 533.233, 576.595, 616.536, 654)), 
                    class = "data.frame", row.names = c(NA, 9L))

Я делаю две отдельные модели с разными базами. Модели на самом деле разные

lmEBase2 <- lm(cumSum~log(sample_number, base = 2),data=d)
lmEBase3 <- lm(cumSum~log(sample_number, base = 3),data=d)

однако прогнозы такие же

logPredBase2 <- predict(lmEBase2, newdata=data.frame(sample_number=1:20))
logPredBase3 <- predict(lmEBase3, newdata=data.frame(sample_number=1:20))
plot  (d$sample_number, d$cumSum, xlim = c(0, 20), ylim = c(0, 1000), type = "b")
lines (1:20, logPredBase2)
lines (1:20, logPredBase3, col = "red")

почему

Я ожидаю, что разные формы логарифмической кривой для разных каркасных баз, как показано в википедии

https://en.wikipedia.org/wiki/Logarithm

1 Ответ

0 голосов
/ 13 мая 2019

Когда мы выполняем линейную регрессию, мы подгоняем линию по следующей формуле

, где

Что доказывает, почему перехваты равны.

Аналогично,

Именно поэтому 229.4*log(2,base = 3) = 144.7, где 229.4 - коэффициент второгоfit и 144.7 - коэффициент первой посадки.И перехваты равны.

Это объясняет, как связаны две выполненные регрессии.

Теперь, если Fit1 равен,

и Fit2:

Мы видим, что Fit2 равен Fit1, снова используя изменение базы.

Поскольку все, что мы использовали, это изменение базы, не имеет значения, какую базу мы используем, все совпадения будут одинаковыми.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...