Заявление о слиянии панд не дает мне разницу между фреймами данных? - PullRequest
0 голосов
/ 05 мая 2018

не может заставить это слияние панд работать правильно. Я хочу знать разницу между df_file_dates_from_directory и df_file_dates_from_sql ДО слияния, которое должно быть 20171211 - 20171218. Кто-нибудь может указать, что не так с моим заявлением о слиянии, пожалуйста? вот распечатки из df's

df_file_dates_from_directory
0     20171211
1     20171212
2     20171213
3     20171214
4     20171215
5     20171218
6     20171219
7     20171220
8     20171221
9     20171222
10    20171226
11    20171227

df_file_dates_from_sql BEFORE merge
    File_date
0    20171219
1    20171220
2    20171221
3    20171222
4    20171226
5    20171227

      #new_df  = df_file_dates_from_sql.merge( df_file_dates_from_directory['File_date'].to_frame(), indicator=True, how='outer')
      new_df = pd.merge(df_file_dates_from_sql, df_file_dates_from_directory['File_date'], on='File_date', how='outer', suffixes=('_left', '_right' ) )

1 Ответ

0 голосов
/ 05 мая 2018
In [364]: (d1.to_frame(name='File_date')
             .merge(d2, how='outer', indicator=True)
             .query("_merge == 'left_only'")
             .drop('_merge',1))
Out[364]:
   File_date
0   20171211
1   20171212
2   20171213
3   20171214
4   20171215
5   20171218
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...