У меня есть два больших фрейма данных: один содержит 3M строк, а другой содержит 2M строк 1-й кадр данных:
sacc_id$ id$ creation_date
0 0011200001LheyyAAB 5001200000gxTeGAAU 2017-05-30 13:25:07
2-й кадр данных:
sacc_id$ opp_line_id$ oppline_creation_date
0 001A000000hAUn8IAG a0WA000000BYKoWMAX 2013-10-26
Мне нужно объединить их:
case = pd.merge(limdata, df_case, left_on='sacc_id$',right_on='sacc_id$')
Но у меня проблема с памятью:
pandas/_libs/join.pyx in pandas._libs.join.inner_join()
MemoryError:
Есть ли другой способ сделать это эффективно.Я читал в некоторых обсуждениях здесь, что Dask может помочь, но я не понимаю, как использовать его в этом контексте.
Любая помощь, пожалуйста?спасибо