Данные панели: работа с запаздывающей и двоичной зависимой переменной с помощью plm - PullRequest
2 голосов
/ 28 июля 2010

Я пытаюсь запустить объединенную логистическую регрессию с данными панели и двоичной зависимой переменной. Поскольку я хотел отставать от некоторых переменных, я использовал пакет plm для их создания. Когда я попытался сделать это другими способами, я столкнулся с проблемами. Я не могу использовать лаг или встраивать, потому что это данные панели.

hybridsubsidies <-pdata.frame(reduced, c("state","year"))

lagee<-(lag(hybridsubsidies$eespending,1))
lagratio<-(lag(hybridsubsidies$ratio, 1))
laggopvote<-(lag(hybridsubsidies$gopvote, 1))
laggasoline<-(lag(hybridsubsidies$gasoline, 1))

Я хотел поместить все переменные в исходный фрейм данных (hybridsubsidies), прежде чем запускать объединенный анализ. Я почти уверен, что мне это не нужно, но я визуальный человек и хотел бы проверить формат данных, подходящий перед выполнением любого анализа.

Из вывода ниже видно, что все сделано правильно.

голова (лаг (hybridsubsidies $ eespending, 1))

ALABAMA-1999 ALABAMA-2000 ALABAMA-2001 ALABAMA-2002 ALABAMA-2003 ALABAMA-2004

     NA        58294        55378        26982        28264         2566 

голова (hybridsubsidies $ eespending)

ALABAMA-1999 ALABAMA-2000 ALABAMA-2001 ALABAMA-2002 ALABAMA-2003 ALABAMA-2004

  58294        55378        26982        28264         2566        26906 

Моя проблема в том, что когда я пытаюсь назначить эту переменную запаздывания в качестве вектора во фрейме данных,

hybridsubsidies$lagee<-(lag(hybridsubsidies$eespending,1))

это так (когда я вызываю имена в кадре данных, они включаются), но тогда я больше не могу просматривать кадр данных. R говорит мне:

Ошибка в edit.data.frame (get (subx, envir = parent), title = subx, ...): может обрабатывать только векторные и факторные элементы

Как я могу решить эту проблему, чтобы я мог просмотреть фрейм данных перед запуском анализа? Я хочу взглянуть на это, так как похоже, что для этого анализа мне придется использовать glm вместо plm (пул), поскольку зависимая переменная является двоичной переменной, и plm не поддерживает эти d.v.

Это давало мне проблемы на некоторое время.

col1 ST YR EELAG EE

[1,] 1 1 NA 58294

[2,] 1 2 58294 55378

[3,] 1 3 55378 26982

[4,] 1 4 26982 28264

[5,] 1 5 28264 2566

[6,] 1 6 2566 26906

[7,] 1 7 26906 29466

[8,] 2 1 NA 355

[9,] 2 2 355 259

[10,] 2 3 259 224

[11,] 2 4 224 217

[12,] 2 5 217 241

[13,] 2 6 241 231

[14,] 2 7 231 231

[15,] 3 1 NA 5111

[16,] 3 2 5111 3753

[17,] 3 3 3753 2211

[18,] 3 4 2211 1452

[19,] 3 5 1452 2913

[20,] 3 6 2913 3128

[21,] 3 7 3128 7132

[22,] 4 1 NA 1597

[23,] 4 2 1597 905

1 Ответ

0 голосов
/ 28 июля 2010

lag возвращает объект временного ряда.

hybridsubsidies$lagee<-(as.vector(lag(hybridsubsidies$eespending,1)))

работать

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...