Я пытаюсь пройтись по циклу данных, чтобы проверить, есть ли какие-либо дубликаты в столбцах определенной строки, и тогда результат должен вернуть всю строку. Столбец, в котором я заинтересован, поднимается от Prod_code_1 до Prod_code_47. Часть моей проблемы заключается в том, как отформатировать имя столбца при сравнении, если значение в одном столбце для этой строки совпадает со смежным столбцом для этой строки.
Если в столбцах определенной строки есть дубликаты, результат должен вернуть всю строку / True.
Столбцы, которые мне нужны, выглядят примерно так (в кадре данных есть куча других столбцов, а не только те, что показаны ниже):
Prod_code_1 | Prod_desc_1 | Prod_code_2 | Prod_desc_2 |
DIS | DIS | DIS | DIS | (returns true)
DIS | DIS | DIS | UVA | (returns false)
И мой код:
for index, row in df.iterrows():
for i in range(1,len(df)):
if df['Prod_code_'+str(i)][row] == df['Prod_code_'+str(i+1)][row]:
print(row)
Ошибка, которую я получаю:
правда серии неоднозначна. Используйте a.empty, a.bool (), a.item (), a.any (), a.all ()
Я знаю, что это должна быть относительно прямолинейная операция, но я застрял и задаюсь вопросом, знает ли кто-нибудь простое решение для моего запроса. Буду очень признателен за любую помощь. Спасибо :).