Что означает формула R из нескольких частей в математических терминах? - PullRequest
7 голосов
/ 08 декабря 2010

В пакете R Formula вводятся понятия для составной формулы, такие как y ~ x1 + x2|I(x1^2).Что эта формула означает математически?Чем это отличается от y ~ x1 + x2 + I(x1^2) или двух независимых y ~ x1 + x2 и y ~ I(x1^2)?

1 Ответ

9 голосов
/ 09 декабря 2010

Вы, похоже, неправильно поняли, для чего предназначен пакет "Формула".Составные формулы могут использоваться для обозначения того, что вы, как пользователь / разработчик, хотите, чтобы они имели в виду.Формула обеспечивает синтаксический сахар вокруг более гибких обозначений формул, предоставляемых пакетом.Составные формулы ничего не значат, пока вы не обработаете формулу для преобразования символического представления в матрицы моделей или аналогичные элементы.1005 *.Это для модели инструментальных переменных, оснащенной двухступенчатой ​​МНК.Часть после | (z1 +z2 + z3) затем интерпретируется функцией ivcoef() как IV, в то время как часть слева от | (x1 + x2) интерпретируется как ковариаты регрессии.ivcoef() строит две модельные матрицы из этих частей RHS формулы, чтобы позволить ей соответствовать двухэтапному OLS. Формула предоставляет код для обработки и управления этими составными формулами, но не указывает, какие статистические модели они используются для представления.

Другой пример - функция hurdle() в пакете pscl , который использует функциональность формулы.В этих моделях одна и та же формула y ~ x1 + X2 | z1 +z2 + z3 будет интерпретироваться по-разному;а именно, бит z1 +z2 + z3 будет использоваться для нулевого барьера (биномиальная часть модели барьеров), тогда как x1 + X2 будет интерпретироваться и использоваться для счетной части модели барьеров.

Моя точкаФормула может быть интерпретирована по вашему желанию, если вы создаете программное обеспечение.Если вы являетесь пользователем, вам необходимо понять, какая модель подходит, прежде чем вы сможете интерпретировать составную формулу с точки зрения статистической модели.Таким образом, нет ответа на ваш вопрос;для составной формулы не существует значения one в математических терминах.

...