Python: создание нескольких строк из строк на основе столбцов - PullRequest
0 голосов
/ 11 июня 2019

У меня есть CSV-файл, который содержит пару ключ-значение, и меня просят объединить все значения, связанные с одним и тем же ключом, в одну строку. Например:

ОБНОВЛЕНИЕ :: ФорматПример данных
CSV-файл со следующими данными:

Key,Link1,Link1S,Link1Dte,Link2,Link2S,Link2Dte,Link3,Link3S,Link3Dte,Link4,Link4S,Link4Dte
 A,A1,S,1/1/2019,C9,T,1/2/2019,C1,N,1/7/2019,C4,W,1/7/2019
 B,A8,S,1/1/2019,C8,W,1/2/2019,,,,,,
 D,A2,S,1/6/2019,C3,T,1/11/2019,D4,W,1/11/2019,,,

Это должно привести к следующему: ЗАПИСИ для значения ключа кадра данных

Key Leg LegS LegT    NLeg NLegS NLegT
A    A1  S   1/1/19   C9  T     1/2/19
A    C9  T   1/2/19   C1  N     1/7/19
A    C1  N   1/7/19   C4  W     1/7/19
B    A8  S   1/1/19   C8  W     1/2/19
D    A2  S   1/6/19   C3  T     1/11/19
D    C3  T   1/11/19  D4  W     1/11/19

Как вы можетевидите, мне нужно было переместить строку со значением Key в качестве первого столбца в несколько строк на основе количества доступных значений ColXXX (а это не более 15 комбинаций). Мне нужно запустить его в большой файл размером около 200K. Key

Мне было интересно, есть ли способ сделать в Python без циклического прохождения по всем записям ... возможно, с помощью groupby (Key), а затем пробежаться по различным столбцам для Key и затем сохранить его в новом фрейме данных

...