Pandas сохранить последнюю строку и совокупное значение - PullRequest
0 голосов
/ 05 августа 2020

У меня есть фреймворк для проектов. Если проект не проходит тест, этот тест повторяется для более поздних данных и переданное значение обновляется. df_Project =

Date    Project_ID  TestA   TestB   TestC   TestD
27072020    Project1    Pass    Pass    Pass    Fail
30072020    Project1    None    None    None    Pass

Я хочу создать еще один фрейм данных, который хранит только последнюю дату и объединяет результаты теста как Pass, если какая-либо дата прошла. df_Summary =

Date    Project_ID  TestA   TestB   TestC   TestD
30072020    Project1    Pass    Pass    Pass    Pass

Как это сделать в pandas?

1 Ответ

3 голосов
/ 05 августа 2020

Вы можете сделать groupby с max

out=df.groupby('Project_ID').max().reset_index()
Out[115]: 
  Project_ID      Date TestA TestB TestC TestD
0   Project1  30072020  Pass  Pass  Pass  Pass

Причина, по которой это работает

'Pass'>'Fail'
Out[116]: True
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...