Пример данных:
000000008,2, 1,000000010
000000009,1, 1,000000011
000000010,1, 1,000000008
000000011,2, 1,000000032
000000012,3, 1,000000009
000000013,2, 1,000000108
Вы можете видеть, что некоторые значения в первом столбце также появляются в четвертом столбце. Я хочу удалить те строки, где значение в четвертом столбце также отображается в любой строке первого столбца.
Следовательно, в этом примере должны быть удалены следующие строки:
000000008,2, 1,000000010
000000010,1, 1,000000008
000000012,3, 1,000000009
000000009,1, 1,000000011
Начальная точка кода:
import numpy as np
import pandas as pd
T = u'''000000008,2, 1,000000010
000000009,1, 1,000000011
000000010,1, 1,000000008
000000011,2, 1,000000032
000000012,3, 1,000000009
000000013,2, 1,000000108'''
from io import StringIO
df = pd.read_csv(StringIO(T), header=None)
print(df)