Я предполагаю, что это довольно простая проблема, но просто не могу заставить код работать правильно. Это упрощенная версия моего фрейма данных.
df = pd.DataFrame([['Jan', 'Apples', 10], ['Feb', 'Apples', 14],
['Jan', 'Oranges', 24], ['Feb', 'Oranges', 18]],
columns = ['Month', 'Fruit', 'Sales'])
Month Fruit Sales
0 Jan Apples 10
1 Feb Apples 14
2 Jan Oranges 24
3 Feb Oranges 18
Затем я хочу вычислить две новые строки, которые представляют собой продажи за февраль минус продажи за январь, сгруппированные по типам фруктов. Я видел функцию diff, которая очевидно работала бы с этим упрощенным фреймом данных. Но мой реальный кадр данных намного больше, и число периодов между значениями, которые я хочу вычесть, не является постоянным. Так что я ищу что-то с loc и groupby (я полагаю).
Очень ценю любой совет.