Pandas заполнить недостающие номера строк и столбцов на основе максимального количества номеров строк - PullRequest
0 голосов
/ 29 мая 2020

У меня есть pandas фрейм данных с 4 столбцами и 8 строками. Как вы можете видеть в desc_1, максимальный размер строки равен 4, если посмотреть на столбец row_num. У некоторых меньше рядов. Я хотел бы заполнить недостающие row_num для каждого desc_1 и оставить desc_2 null.

Текущий фрейм данных:

df
  desc_1    desc_2      col_num  row_num
0 lat_mov   valid_acct  1        2     
1 collect   loc id      2        1 
2 execution proj file   3        1 
3 execution script      3        3 
4 execution man in mid  3        2
5 lat_mov   rem file    1        1
6 execution prog org    3        4 
7 discovery net sniff   4        1 

Желаемый результат (#<- new не должен быть в окончательном фрейме данных, он нужен только для выделения новых строк):

df
   desc_1    desc_2      col_num  row_num
0  lat_mov   rem file    1        1 
1  collect   loc id      2        1
2  execution proj file   3        1
3  discovery net sniff   4        1
4  lat_mov   valid_acct  1        2
5  collect   null        2        2        #<- new
6  execution man in mid  3        2
7  discovery null        4        2        #<- new
8  lat_mov   null        1        3        #<- new
9  collect   null        2        3        #<- new    
10 execution script      3        3        
11 discovery null        4        3        #<- new
12 lat_mov   null        1        4        #<- new
13 collect   null        2        4        #<- new
14 execution prog org    3        4
15 discovery null        4        4        #<- new

Возможно ли это даже в python, или я должен просто вручную сделать это в excel (yuck)?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...