Во-первых, извините за сложный вопрос от несложного пользователя. Я - медицинский исследователь, пытающийся составить список людей, у которых было и КТ и рентген в течение 3 месяцев. У меня есть два документа excel / csv:
(1) - это все люди, которые прошли компьютерную томографию и имеют четыре заголовка: Ref_CT, Date_CT, ID пациента_CT, Имя пациента_CT;
(2) - все люди у кого был рентген и четыре: рентгенография, дата, идентификатор пациента, идентификатор пациента.
В обоих этих исключениях только ссылки являются уникальными значениями, так как у большинства людей есть 2+ исследования, и несколько исследований происходят в одну и ту же дату.
Моя цель - напечатать строки: ID пациента; Имя пациента; CT_Date; Xray_1_Date; Xray_2_Date; ... Xray_10_Date (у людей было до 10 рентгеновских снимков). Любой совет по использованию техники, пусть и общий, будет фантастическим c.
Огромное спасибо
Фреймы данных (1) (смещение заголовков для простоты интерпретации)
Ref_CT Date_CT Patient ID_C Patient Name_CT
0 1 9/8/2019 12345 PersonA, Felix (Mr)
1 2 9/6/2018 12346 PersonB, Anthony(Mr)
2 3 9/6/2017 12347 PersonC, Trev (Mrs)
3 4 9/6/2016 12348 PersonD, Jeremy (Mr)
4 5 9/8/2015 12348 PersonD, Jeremy (Mr)
(2)
X-Ray Ref Date Patient ID Patient Name
0 1 9/10/2019 12345 PersonA, Felix (Mr)
1 2 9/10/2018 12345 PersonA, Felix (Mr)
2 3 9/10/2017 12345 PersonA, Felix (Mr)
3 4 9/10/2016 12347 PersonC, Trev (Mrs)
4 5 9/10/2015 12348 PersonD, Jeremy (Mr)
Ожидаемый результат
Patient_ID CT_Date XR1_Date XR2_Date XR3_date
0 12345 9/8/2019 9/10/2019 9/6/2018 9/16/2017
1 12346 9/6/2019
2 12347 9/6/2017 9/10/2016
3 12348 9/6/2016 9/10/2015
4 12348 9/8/2015 9/10/2015
(Спасибо, @sammywemmy, за совет по более интересному вопросу)