У меня есть CSV-файл, который содержит пару ключ-значение, и меня просят объединить все значения, связанные с одним и тем же ключом, в одну строку. Например:
ОБНОВЛЕНИЕ :: ФорматПример данных
CSV-файл со следующими данными:
Key,Link1,Link1S,Link1Dte,Link2,Link2S,Link2Dte,Link3,Link3S,Link3Dte,Link4,Link4S,Link4Dte
A,A1,S,1/1/2019,C9,T,1/2/2019,C1,N,1/7/2019,C4,W,1/7/2019
B,A8,S,1/1/2019,C8,W,1/2/2019,,,,,,
D,A2,S,1/6/2019,C3,T,1/11/2019,D4,W,1/11/2019,,,
Это должно привести к следующему: ЗАПИСИ для значения ключа кадра данных
Key Leg LegS LegT NLeg NLegS NLegT
A A1 S 1/1/19 C9 T 1/2/19
A C9 T 1/2/19 C1 N 1/7/19
A C1 N 1/7/19 C4 W 1/7/19
B A8 S 1/1/19 C8 W 1/2/19
D A2 S 1/6/19 C3 T 1/11/19
D C3 T 1/11/19 D4 W 1/11/19
Как вы можетевидите, мне нужно было переместить строку со значением Key в качестве первого столбца в несколько строк на основе количества доступных значений ColXXX (а это не более 15 комбинаций). Мне нужно запустить его в большой файл размером около 200K. Key
Мне было интересно, есть ли способ сделать в Python без циклического прохождения по всем записям ... возможно, с помощью groupby (Key), а затем пробежаться по различным столбцам для Key и затем сохранить его в новом фрейме данных