У меня есть номер для каждого человека в течение определенного месяца, представленный целым числом. Мне нужно добавить эти цифры для каждого человека до указанной даты для каждой строки. Я хотел бы использовать функцию apply в Python DataFrame, чтобы сделать его масштабируемым.
Например:
df = pd.DataFrame(
{'number': [10, 20 , 30, 40, 50], 'individual': ["John", "John" , "Eleonor", "Eleonor", "Eleonor"], 'date': [1, 2, 3, 4, 5]})
df =
number individual date
0 10 John 1
1 20 John 2
2 30 Eleonor 3
3 40 Eleonor 4
4 50 Eleonor 5
Я хочу суммировать числа, когда дата строго ниже, чем дата в строке, и поставить NA, если нет строки с датой, которая удовлетворяет условию.
Здесь результат будет:
number individual date
0 NA John 1
1 10 John 2
2 NA Eleonor 3
3 30 Eleonor 4
4 70 Eleonor 5