Необходимо понять, как я могу пропустить интерактивное приглашение при выполнении pandas_dedupe.dedupe_dataframe () - PullRequest
0 голосов
/ 14 февраля 2019

Я пытаюсь использовать pandas "pandas_dedupe.dedupe_dataframe" pkg / function для поиска кластеров записей, имеющих похожие свойства при определенном выборе столбцов. Проблема в том, что я интегрирую этот код с моим UI-приложением и не хочу, чтобы мои пользователи виделиприглашение выдается pandas_dedupe.dedupe_dataframe ().Я хочу, чтобы он принял значения по умолчанию и не ждал внешних входов в кластер. Я понимаю, что это немного нелогично - пропустить этот учебный процесс, но у меня нет выбора, скорее пропустить этот процесс Q / A. Прикрепил пример кода и снимок. Любая документация этого пакета о том, какие параметры он принимает?

import pandas as pd
import pandas_dedupe

#load dataframe
df = pd.read_csv('Lobbyists_2012_present.csv')

инициирует дедупликацию

df_final = pandas_dedupe.dedupe_dataframe(df,['LOBBYIST LAST NAME','LOBBYIST FIRST NAME','LOBBYIST MIDDLE INITIAL'])

отправляет вывод в csv

df_final.to_csv('deduplication_output.csv')

введите изображениеописание здесь

...