Python: найти уникальное значение в 2-х фреймах данных и избежать дубликатов - PullRequest
0 голосов
/ 17 сентября 2018

У меня есть два фрейма данных

df1 = [1, 2, 3, 4, 5]
df2 = [1, 2, 3, 7, 9]

Я хочу получить новый Df только с [4,5] (я написал число, но реальный список - это два списка электронных писем). Затем я включу сохранение.DataFrame в CSV-файл

Как я могу это сделать?

Ответы [ 3 ]

0 голосов
/ 17 сентября 2018

Diff pandas dataframes:

import pandas as pd
df1 = pd.DataFrame([1, 2, 3, 4, 5])
df2 = pd.DataFrame([1, 2, 3, 7, 9])
df3 = df1.merge(df2, indicator=True, how='outer')
df3[merged['_merge'] == 'left_only']

Объединение pandas dataframes:

df4 = pd.concat([df1, df2]).drop_duplicates(keep=False)

0 голосов
/ 17 сентября 2018

Похоже, они list, тогда мы используем set

set(df1)-set(df2)
Out[398]: {4, 5}
0 голосов
/ 17 сентября 2018
df1 = [1, 2, 3, 4, 5]
df2 = [1, 2, 3, 7, 9]
[x for x in df1 if x not in df2]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...