У меня есть несколько большой кадр данных панд (100000x9).Первые два столбца представляют собой комбинацию имен, связанных со значением (с обеих сторон).Я хочу удалить нижнее значение, связанное с данной комбинацией.
Я еще ничего не пробовал, потому что я не уверен, как решить эту проблему.Мое первое впечатление - мне нужно использовать функцию apply для фрейма данных, но мне нужно выбрать каждую комбинацию «first» и «second», сравнить их и затем удалить эту строку.
df = pd.DataFrame(np.array([['John','Mary',5],['John','Mark',1], ['Mary','John',2], ['Mary','Mark',1], ['Mark','John',3], ['Mark','Mary',5]]), columns=['first','second','third'])
df
first second third
0 John Mary 5
1 John Mark 1
2 Mary John 2
3 Mary Mark 1
4 Mark John 3
5 Mark Mary 5
Моя цель - получить этот фрейм данных
df_clean = pd.DataFrame(np.array([['John','Mary',5], ['Mark','John',3], ['Mark','Mary',5]]), columns=['first','second','third'])
df_clean
first second third
0 John Mary 5
1 Mark John 3
2 Mark Mary 5
Есть идеи?