У меня есть фрейм данных с PatientID и датами, отсортированными по порядку дат в пределах ID.У каждого пациента обычно есть несколько строк, хотя возможно иметь только одну.Например:
patid date
1302 2009-01-27
1302 2009-02-05
1302 2009-08-28
1670 2009-03-12
2073 2009-04-03
2073 2010-11-01
2073 2010-12-19
2073 2011-03-06
Исходя из этого, я хочу создать файл данных или файл CSV с датами начала и окончания для каждого пациента, поэтому из вышеприведенного я получу
patid start end
1302 2009-01-27 2009-08-28
1670 2009-03-12 2009-03-12
2073 2009-04-03 2011-03-06
У меня более 30 миллионов строк в исходном файле, поэтому я бы предпочел не писать цикл for
.
Интересно, есть ли эффективный способ сделать это, возможно, начать с использования * 1010?* получить количество строк для каждого пациента?