Альтернатива DataFrame.to_sql (), которая будет добавлять неповторяющиеся строки - PullRequest
0 голосов
/ 11 декабря 2018

В настоящее время DataFrame.to_sql () имеет параметр, который дает возможность добавлять, заменять или не выполнять, если таблица существует.

Проблема в том, что это проверяет только на уровне таблицы.Он добавляет весь Dataframe вместо добавления неповторяющихся записей из существующего Data Frame.

Я ищу простой способ добавить записи без дубликатов в базу данных Postgres, используя приведенную выше функцию

В идеале это выглядело бы примерно так -

DataFrame.to_sql(name, con, if_exists='append', index=False, keys=['id', 'name', 'date'])  

Параметр keys будет передавать уникальные столбцы, чтобы найти уникальность.Если такая комбинация не существует, вы должны добавить запись DataFrame в БД.

Я ищу простой способ вставить / добавить DataFrame в Postgres, если он не существует в определенном наборе столбцов.

...