Давайте предположим, что у меня есть pandas DataFrame в Python, который показывает имя лидера бизнес-единицы для различных единиц во времени . Это может выглядеть примерно так: это
и может быть воссоздан как:
import pandas as pd
import numpy as np
d = pd.DataFrame({'Boss_January': ['Nina', 'Lena', 'Max', np.NaN], 'Boss_February': ['Nina', 'Emilia','Max','Leonie'],'Boss_March':['Nina','Lena','Mark','Leonie']})
Я хотел бы найти единицы, в которых произошла смена лидера бизнес-единицы, то есть строки, в которых значения в разных столбцах не совпадают.
Результат должен включать Единицу 1, Единицу 2 и Единицу 3 из-за изменений в лидере единицы (и отсутствующее значение), но исключать Единицу 0.
Поскольку в реальном DataFrame гораздо больше столбцов, я не хочу проверять все значения, перебирая строки и проверяя, Boss_January == Boss_Feb February == Boss_March .