Я новичок в python pandas, у меня возникла проблема с поиском различий для 2 списков в рамках панды данных.
Пример ввода с разделителем ;
:
ColA; ColB
A,B,C,D; B,C,D
A,C,E,F; A,C,F
Ожидаемый результат:
ColA; ColB; ColC
A,B,C,D; B,C,D; A
A,C,E,F; A,C,F; E
То, что я хочу сделать, похоже на:
df['ColC'] = np.setdiff1d( df['ColA'].str.split(','), df['ColB'].str.split(','))
Но возвращается ошибка:
повышение ValueError («Длина значений не соответствует длине индекса», data, index, len (data), len (index))
Пожалуйста, сообщите