У меня есть датафрейм.Содержит df['article_id']
.Я использую to_sql
функцию с sqlalchemy
для вставки в мою базу данных.Однако иногда у меня есть дубликаты записей, которые я хочу удалить перед вставкой.
Это мой список:
usedIDs = []
select_st = select([article_table])
res = conn.execute(select_st)
for _row in res:
clean = int(_row[1])
usedIDs.append(clean)
usedIDs
С выводом:
[1202623831,
1747352473,
1748645480,
1759957596,
1811054956,
1812183879,
1816974229,
2450784233,
2579244390,
2580336884]
Что я 'я пробовал:
df[~df.isin(usedIDs)]
df.drop(usedIDs, axis=0)
И это не работает.Однако, когда я жестко кодирую его, как показано ниже, он работает.
df = df[~df.article_id.isin(['1202623831','1747352473'])]
Ошибка: unhashable
или KeyError: not found in axis
.
Как я могу отбросить строки из моего кадра данных, где df['article_id']
находится в usedIDs
списке?