Как сравнить один кадр данных с другим и проверить, присутствуют ли те же данные в первом df во втором df - PullRequest
0 голосов
/ 16 мая 2019

имеют два df.both df с одним столбцом и одинаковыми именами

df1 имеет 40000 строк, а df 2 имеет 80000 строк.

Как сравнить, совпадают ли данные в df1 сdf2.

Ожидаемый вывод: любое сообщение о том, что 40000 строк в df1 совпадают с df2, имеющим 80000 строк

40000 items in df1 matched with 80000 items in df2 


Ответы [ 4 ]

1 голос
/ 16 мая 2019

Используйте это:

match = df1[df1['column name'].isin(df2['column name'])].shape[0]


print(('%.i items matched') % match)
1 голос
/ 16 мая 2019

Попробуйте:

   matches = (df2 == df1).stack()
1 голос
/ 16 мая 2019

Что-то вроде:

m = df1['c'] == df2['c']
print('{0:d} items in df1 matched with {1:d} items in df2'.format(sum(m), len(m)))
0 голосов
/ 16 мая 2019
df = pd.DataFrame(data1, columns = ['A'])
df2 = pd.DataFrame(data2, columns = ['A'])
df
    A
0  10
1  15
2  14
3  20
4  25
5  26

 df2
    A
0  10
1  15
2  14
3  20
4  25
5  26
6  30
7  32
8  34
9  36



df2[df2.A.isin(df.A.values)]
    A
0  10
1  15
2  14
3  20
4  25
5  26

Соответствующий элемент

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...