У меня есть фрейм данных Pandas, и я работаю в записной книжке Jupyter. Я хочу выделить строки, в которых дублируются пары столбцов. Вот пример:
colA = list(range(1,6))
colB = ['aa', 'bb', 'aa', 'cc', 'aa']
colC = [14,3,14,9,12]
colD = [108, 2001, 152, 696, 696]
df = pd.DataFrame(list(zip(colA, colB, colC, colD)), columns =['colA', 'colB', 'colC', 'colD'])
display(df)
Я хочу выделить эти строки, потому что значения в colB и col C дублируются:
Я пробую эту лямбда-функцию, но она выдает ошибку (и только для одного столбца):
df.style.applymap(lambda x: 'background-color : yellow' if x[colB].duplicated(keep=False) else '')
TypeError: ("'int' object is not subscriptable", 'occurred at index colA')
Спасибо за любую помощь