Я пытаюсь использовать pandas "pandas_dedupe.dedupe_dataframe" pkg / function для поиска кластеров записей, имеющих похожие свойства при определенном выборе столбцов. Проблема в том, что я интегрирую этот код с моим UI-приложением и не хочу, чтобы мои пользователи виделиприглашение выдается pandas_dedupe.dedupe_dataframe ().Я хочу, чтобы он принял значения по умолчанию и не ждал внешних входов в кластер. Я понимаю, что это немного нелогично - пропустить этот учебный процесс, но у меня нет выбора, скорее пропустить этот процесс Q / A. Прикрепил пример кода и снимок. Любая документация этого пакета о том, какие параметры он принимает?
import pandas as pd
import pandas_dedupe
#load dataframe
df = pd.read_csv('Lobbyists_2012_present.csv')
инициирует дедупликацию
df_final = pandas_dedupe.dedupe_dataframe(df,['LOBBYIST LAST NAME','LOBBYIST FIRST NAME','LOBBYIST MIDDLE INITIAL'])
отправляет вывод в csv
df_final.to_csv('deduplication_output.csv')
введите изображениеописание здесь