У меня есть pandas dataframe, который выглядит следующим образом:
real_value, prediction
'invalid', 'inv'
'invalid', 'neg'
'invalid', 'inv'
'negative', 'neg'
'negative', 'neg'
'negative', 'neg'
'positive', 'pos'
'positive', 'pos'
'positive', 'inv'
Я хотел бы выбрать все строки, в которых прогноз и реальное значение являются несовпадением, другими словами Я хотел быхотел бы получить фрейм данных, который выглядит как :
real_value, prediction
'invalid', 'neg'
'positive', 'inv'
Я пытался df.loc[~df.prediction.isin(df.real_value)]
, но это не работает. Его легко выбрать на основе значения SPECIFIC, USER DEFINED, например, df.loc[~df.prediction.isin(['neg'])]
, но я не могу найти способ выбора на основе значений, встречающихся в самих строках.
Как получить желаемоевыбор? Спасибо