У меня есть два кадра данных панд, скажем, df1 и df2.
У df1 есть 6 переменных, а у df2 5 переменных.
и первая переменная в обоих фреймах данных находится в строковом формате, а расширение - в формате int.
Я хочу определить несовпадающие записи в обоих фреймах данных, используя первые 3
столбцы обоих фреймов данных и должны исключать их из фрейма данных df1.
для этого я попробовал следующий код, но он выдает значения Nan для меня, если я уроню
Значения Nan, тогда необходимые данные будут удалены.
входные данные: -
**df1:-** **df2:-**
x1 x2 x3 x4 x5 x6 x1 x2 x3 x4 x5
SM 1 1 2 3 3 RK 2 4 3 4
RK 2 2 3 4 5 SM 1 1 3 3
NBR 1 2 2 5 6 NB 1 2 3 2
CBK 2 5 6 7 8 VSB 5 6 3 2
VSB 5 6 4 2 1 CB 2 6 4 1
SB 6 2 3 2 1 SB 6 2 4 1
expected_out_put: -
x1 x2 x3 x4 x5 x6
RK 2 2 3 4 5
CBK 2 5 6 7 8
NBR 1 2 2 5 6
Синтаксис: -
data_out=df1[~df1['x1','x2','x3'].isin(df2['x1','x2','x3'])]
data_out=data_out.dropna()
пожалуйста, кто-нибудь может помочь мне справиться с этим.
Заранее спасибо.