У меня есть набор данных панели, состоящий из облигаций с дневными ценами, наблюдаемыми в течение определенного периода времени. Таким образом, каждая облигация повторяется вниз с соответствующими ежедневными ценовыми наблюдениями и датами (см. Рисунок ниже). Половина связей обозначена зеленым цветом (определяется фиктивной переменной), и каждая зеленая связь сопоставляется с не зеленой связью, каждая пара идентифицируется идентификатором пары. Таким образом, зеленая связь и соответствующая ей не зеленая связь имеют одинаковый идентификатор пары и наблюдаются в течение одного и того же промежутка времени (скажем, 100 дней каждый), но индивидуальный идентификатор связи уникален.
Я хочу измерить фиксированный эффект в каждой паре облигаций, чтобы выяснить, существует ли значительная разница в доходности к погашению (переменная used = ask.yield) между зеленой облигацией и соответствующей ей не зеленойсвязь. Таким образом, я полагаю, что при идентификации данных панели в R, индивидуум должен быть pair.id, а индекс времени должен быть date. Я использую следующую регрессию:
fixed <- plm(ask.yield ~ liquidity + green, data = paneldata, index = c(“pair.id”, “dates”), model = “within”)
Желаемый вывод (не обращайте внимания на цифры):
Я получаю сообщение об ошибке:
Ошибка в pdim.default (индекс [ 1 ], индекс [ 2 ]): повторяющиеся пары (id-time)
Я понимаю сообщение об ошибке - каждый pair.id в данных панели записывается дважды за одни и те же даты (один раз для зеленой облигации и один для соответствующей не зеленой облигации).
Кто-нибудь знаеткак обойти эту проблему и все же быть в состоянии измерить фиксированный эффект в каждой паре облигаций?