Мой входной df такой, как показано ниже:
ID item1 item2 item3
1 a,b b,c b
2 a,c,f b,c b,c,f
3 g,h,i i h,i
4 j,k j,k l
df Типы данных для item1, item2 и item3 имеют строковый тип.
Я хотел бы добавить 4-й столбец, и преобразование требуется как ниже: псевдокод:
Final_item = item3 - set[col(item1) + col(item2)]
Обычно в последнем столбце добавляются item1 и item2, затем применяется set для удаления дубликатов, а затем вычитается из столбца item3.
Желаемый выход, как показано ниже:
ID item1 item2 item3 Final_item
1 a,b b,c b a,c
2 a,c,f b,c b,c,f a
3 g,h,i i h,i g
4 j,k j,k l j,k