У меня есть два кадра данных, sales
и plan
, как указано ниже:
units
retailer product date
1 1 2018-12-30 355
1 1 2017-12-31 312
1 1 2018-01-01 370
...
plan_units
retailer product date
1 1 2018-01-01 360
1 1 2018-01-02 380
1 1 2018-01-03 330
...
[retailer, product, date]
- это индекс.
Перед объединением sales['units'].sum()
составляет 123 456.Однако:
pd.merge(sales, plan, left_index=True, right_index=True, how='outer')['units'].sum()
равно 257,379 , т. Е. Больше, чем я имел раньше.
Индексы двух кадров данных не совпадают, следовательно, how='outer'
.Однако, как я получаю больше в объединенном результате?