Как мне pd.merge, не создавая копию данных? - PullRequest
0 голосов
/ 11 декабря 2018

Я пытаюсь объединить два фрейма данных следующим образом:

df3 = pd.merge(df1,df2, how='inner', on='key')

, где df1 и df2 - большие наборы данных с миллионами строк.В основном, как мне присоединиться к ним без необходимости создавать третий фрейм данных df3.

Я просто хочу присоединить один к следующему, меняя оригинал.У меня недостаточно памяти для работы на моем сервере, поэтому мне нужно что-то более эффективное.

1 Ответ

0 голосов
/ 11 декабря 2018

Вы можете попробовать это.Я не уверен, как ваши данные выглядят так просто гадать.

import pandas as pd

def merge_dataset(df1, df2):
    df1 = df1.merge(df2, how='inner', on='key')
    print(df1)
    return df1

if __name__ == '__main__':

  d1 = {'col1': [1, 2], 'key': [3, 4]}
  d2 = {'col2': [5,6], 'key': [3, 4]}
  df1 = pd.DataFrame(data=d1)
  df2 = pd.DataFrame(data=d2)
  # Debug 
  print(df1)
  print(df2)
  merge_dataset(df1, df2)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...