У меня есть файл от SAP, который не был самым красивым при работе с данными. Поэтому, используя series.str.contains()
и логические маски, мне удалось сузить область данных до следующего вида:
0 1
0 SUB 123
1 CAT SKU
2 CODE 1000123
3 CODE 1000234
4 SUB 456
5 CAT LIQ
6 CODE1 1000345
7 CODE1 1000534
8 CODE1 1000433
Я ищу способ разделить каждую SUB
на новую запись, как показано ниже:
print(expected_df)
SUB CAT CODE CODE1
0 123 SKU 1000123.0 NaN
1 123 SKU 1000234.0 NaN
2 456 LIQ NaN 1000345.0
3 456 LIQ NaN 1000534.0
4 456 LIQ NaN 1000433.0
Я просто не могу пройти этот шаг. Тем не менее, эта строка:
df[0].eq('SUB').cumsum()
помогает разделить группы и при необходимости может использоваться в качестве вспомогательного ряда.
Любая помощь в переносе данных, как показано, будет очень признательна.
Спасибо.