У меня есть данные, считываемые из файла Excel, в котором есть несколько объединенных ячеек. Поэтому, когда я читаю файл в Dataframe, я получаю ряд строк, количество которых варьируется в зависимости от количества объединенных ячеек с «NaN».
Моя проблема заключается в том, что в каждой из этих строк есть два столбца, в которых есть данные, которые мне нужно сгруппировать и добавить в качестве столбца к первой «реальной» строке
Данные выглядят следующим образом
ServerName IP AZ Drives Size
SAPPHY00 192.45.323.10 B C:Drive 80GB
NaN NaN NaN F:DATA 200GB
NaN NaN NaN G:Buffer 300GB
SAPPH000 192.342.3.4 A C:Drive 80GB
NaN NaN NaN P:Paging 64GB
SAPPD000 193.45.3.2 B C:Drive 80GB
Что я хочу
ServerName IP AZ Drives Size Grouped Drives Grouped Drive Size
SAPPHY00 192.45.323.10 B C:Drive 80GB [C:Drive,F:DATA,G:Buffer] [80GB,200GB,300GB]
SAPPH000 192.342.3.4 A C:Drive 80GB [C:Drive,F:Paging] [80GB,64GB]
SAPPD000 193.45.3.2 B C:Drive 80GB [C:Drive] [80GB]
Размер сгруппированных дисков и сгруппированных дисков может быть даже одним столбцом
У кого-нибудь есть предложения, я попробовал GroupBy, но, возможно, я делал этонеправильно
Еще раз спасибо за любую помощь