Вы должны быть в состоянии сделать это, если вы управляете объемом данных, которые у вас есть. Поскольку вам только нужен идентификатор клиента, не беспокойтесь о загрузке любых других данных в ваш фрейм данных.
customer_id_array = []
with open('online_pageviews.json') as f:
for line in f:
customer_id_array.append(json.loads(line)['customer_id'])
online_pageviews = pd.DataFrame(customer_id_array,columns = ['customer_id'])
Таким образом, вы можете значительно сократить объем дополнительной памяти, которой вы были ранее используя.
(Я не уверен, сможет ли ваша система справиться с этим, поскольку customer_id_array
все еще может стать довольно большим, но это должно быть намного лучше, чем раньше. Если это невозможно, вам, возможно, придется поискать некоторые онлайн-варианты для аренда систем с большей памятью.)