df - боевые события годами и конфликтами. Я пытаюсь вычислить среднее расстояние (по времени) между битвами в годы конфликта.
Заголовок выглядит примерно так:
conflictId | year | event_date | event_type
107 1997 1997-01-01 1
107 1997 1997-01-01 1
20 1997 1997-01-01 1
20 1997 1997-01-01 2
20 1997 1997-01-03 1
То, что я впервые попробовал, было
time_prev_total <- aggregate (event_date ~ conflictId + year, data, diff)
но я получаю event_date
список в новом df. Попытки извлечь первую позицию индекса в списке в df не увенчались успехом.
В качестве альтернативы мне предложили создать индекс времени в каждом конфликтном году, затем отстать от этого индекса, создать новый фрейм данных с conflictId
, year
, event_date
и отстающий индекс, и затем объедините его с исходным df, но сопоставьте отстающий индекс в новом df со старым индексом в исходном df. Я пытался реализовать это, но я немного не уверен, как индексировать obs. в годы конфликта, поскольку он неуравновешен.