Я работаю над данными с пандами, в которых выполняются работы по техническому обслуживанию на месте.Техническое обслуживание проводится каждые четыре года на каждом объекте.Я хочу найти годы с момента последнего технического обслуживания на каждом объекте.Я приведу здесь только два сайта в следующем примере, но в исходном наборе данных у меня их тысячи.Мои данные охватывают только 2014–2017 годы.
Действие = 0 означает, что в этом году не было выполнено никаких действий, Действие = 1 означает, что какое-то действие было выполнено.Измерение - это показание производительности, связанное с эффектом действия.Действие может произойти в любой год.Я знаю, что если действие было выполнено в Году Y, предыдущее обслуживание было выполнено в Году Y. 4.
Site Year Action Measurement
A 2014 0 100
A 2015 0 150
A 2016 1 300
A 2017 0 80
B 2014 0 200
B 2015 1 250
B 2016 0 60
B 2017 0 110
С учетом этого набора данных;во-первых, я хочу иметь временный набор данных, подобный этому:
Item Year Action Measurement Years_Since_Last_Action
A 2014 0 100 2
A 2015 0 150 3
A 2016 1 300 4
A 2017 0 80 1
B 2014 0 200 3
B 2015 1 250 4
B 2016 0 60 1
B 2017 0 110 2
Затем я хочу иметь:
Years_Since_Last_Action Mean_Measurement
1 70
2 105
3 175
4 275
Заранее спасибо!