MemoryError объединяет 2 набора данных - PullRequest
1 голос
/ 11 апреля 2020

Эй, ребята, я прошу решение проблемы слияния данных

У меня есть 2 набора данных

df_311.shape 
(999999, 16)
df_bldg.shape
(855058, 12)

Я хочу объединить эти 2 набора данных, используя столбец ZipCode, существующий в обоих наборы данных.

df_total = pd.merge(df_311,df_bldg,how='inner',on='ZipCode')

и появляется эта ошибка

MemoryError: Unable to allocate 35.9 GiB for an array with shape (4824979078,) and data type int64

Не могли бы вы помочь мне, пожалуйста, пытаясь найти решение этой проблемы?

...