Pandas DataFrame, Как агрегировать, когда ваши данные имеют все столбцы, кроме NaN - PullRequest
0 голосов
/ 08 ноября 2019

У меня есть данные, считываемые из файла Excel, в котором есть несколько объединенных ячеек. Поэтому, когда я читаю файл в Dataframe, я получаю ряд строк, количество которых варьируется в зависимости от количества объединенных ячеек с «NaN».

Моя проблема заключается в том, что в каждой из этих строк есть два столбца, в которых есть данные, которые мне нужно сгруппировать и добавить в качестве столбца к первой «реальной» строке

Данные выглядят следующим образом

ServerName IP            AZ        Drives       Size    
SAPPHY00   192.45.323.10 B        C:Drive        80GB
NaN        NaN           NaN      F:DATA         200GB
NaN        NaN           NaN      G:Buffer       300GB
SAPPH000   192.342.3.4   A        C:Drive        80GB
NaN        NaN           NaN      P:Paging       64GB
SAPPD000   193.45.3.2    B        C:Drive        80GB

Что я хочу

ServerName IP            AZ        Drives       Size    Grouped Drives            Grouped Drive Size
SAPPHY00   192.45.323.10 B        C:Drive        80GB   [C:Drive,F:DATA,G:Buffer] [80GB,200GB,300GB]
SAPPH000   192.342.3.4   A        C:Drive        80GB   [C:Drive,F:Paging]        [80GB,64GB]
SAPPD000   193.45.3.2    B        C:Drive        80GB   [C:Drive]                 [80GB]

Размер сгруппированных дисков и сгруппированных дисков может быть даже одним столбцом

У кого-нибудь есть предложения, я попробовал GroupBy, но, возможно, я делал этонеправильно

Еще раз спасибо за любую помощь

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...