Существует большая таблица, которую нужно перенести (обновить / вставить), используя библиотеку Python Pandas с новым фреймом данных (который содержит последние данные).
Я мог бы сделать это, учитывая всю таблицу. Нотак как таблица тяжелая и в будущем будет становиться все тяжелее, я ищу варианты вставки по частям в таблице.
Ниже приведен текущий код для сохранения таблицы. data_frame2 - новый фрейм данных (содержит последние данные).
engine = create_engine("mysql+pymysql://username:password@hostname/schema")
con = engine.connect()
sql1 = "select * from table1"
df1 = pd.read_sql(sql1, con)
#(upsert code starts),can below code be converted into chunkwise upsert
#data_frame2 is the data frame with latest data/new data.
df_final = pd.concat([df1, data_frame2[~data_frame2.index.isin(df1.index)]])
df_final.update(data_frame2)
#upsert code ends
#writing data chunkwise
df_final.to_sql(con=con,name='table1',if_exists='replace',chunksize=100000)
Я исследовал в Интернете, но не смог найти способ, которым мы можем сделать продольное (обновление / вставка) по кусочкам таблицы с новыми данными в панде dataframe. Пожалуйста, предложите, как это можно сделать..