Формула должна быть обычным объектом формулы, используемым в большинстве функций моделирования в R (например, lm()
, glm()
и т. Д. c.). Вы можете получить подробную информацию о том, как написать формулу, набрав help(formula)
в командной строке R.
По сути, формула является выражением формы y ~ model
. Цитирование из раздела подробностей help(formula)
:
Выражение формы y ~ модель интерпретируется как спецификация того, что ответ y моделируется линейным предиктором, заданным символически моделью.
В вашем примере, предполагая, что у вас есть 3 предиктора, называемые x1
, x2
, x3
(которые могут быть numeric
или factor
переменными), вы можете написать:
mydataBrAll <- logistf(formula = Verkauft ~ x1 + x2 + x3, data = mydataBr, pl = FALSE)
summary(mydataBrAll)
Обратите внимание, что формула может быть более сложной и включать преобразования переменных предиктора. Опять же, для получения более подробной информации см. Документацию formula
.
. Как вы знаете, выражение attr(data, "formula")
, показанное в документации logistf()
как часть сигнатуры функции (иначе API), относится к атрибут с именем formula
, который может существовать в объекте, содержащем данные, которые вы передаете в параметре data
функции. Поскольку в вашем примере это не так (очевидно, вы не добавили этот атрибут в свой объект данных), вы должны явно определить формулу при вызове logistf()
.
Для получения дополнительной информации об атрибутах в объектах см. help(attr)
.
По второму вопросу о обратном выборе: в разделе «Подробности» документации для logistf()
вы видите следующее предложение:
Кроме того, функции прямого и обратного выполнения удобный выбор переменной
Т.е. пакет содержит функции forward()
и backward()
, которые могут использоваться для выполнения прямого и обратного выбора предикторов.
Функция step()
может также работает, так как ничто не указывает на обратное на странице документации.