У меня есть датафрейм, который в настоящее время выглядит так:
index serial email firstname lastname country job course completed
0 0005 one@two.com David Smith US Sales course1 Y
1 0076 three@two.com John Bloggs GB Exec course2 Y
2 0005 one@two.com David Smith US Sales course2 Y
3 0005 one@two.com David Smith US Sales course3 Y
4 NaN foo@bar.com Foo Bar IN ext course2 Y
5 NaN bar@foo.com Bar Far NZ ext course2 Y
... ... ... ... ... ... ... ...
Я бы хотел нормализовать этот фрейм данных, чтобы человек появлялся только один раз (в одной строке). Другими словами, я хотел бы преобразовать это во что-то вроде этого:
index serial email firstname lastname country job course1 course2 course3
0 0005 one@two.com David Smith US Sales Yes Yes Yes
1 0076 three@two.com John Bloggs GB Exec NaN Yes NaN
2 NaN foo@bar.com Foo Bar IN ext NaN Yes NaN
3 NaN bar@foo.com Bar Far NZ ext NaN Yes NaN
... ... ... ... ... ... ... ... ...
Обратите внимание, что уникальный идентификатор - это серийный номер сотрудников компании (job == Sales или Exec), а для внешних сотрудников (job == ext) - их электронная почта.