У меня есть фрейм данных, который содержит записи за 8 лет. Столбцы, которые меня здесь интересуют, - это created_on и resolved_on, которые являются типами datetime64.
Каждая строка имеет datetime created_on, которая устанавливает, когда она была открыта. Строки будут иметь дату и время resolved_on, если они были разрешены, но пустое, если все еще не выполнено.
Например:
df1:
created_on resolved_on
...
31/07/20
01/08/20 04/08/20
01/08/20 03/08/20
02/08/20 02/08/20
...
Мне нужен dataframe, который имеет каждую дату, начиная с 2012 года, который имеет средний_ возраст невыполненных записей для каждой данной даты.
df2:
date average_age
...
31/07/20
01/08/20
02/08/20
03/08/20
04/08/20
...
Это постоянно обновляемый источник данных, поэтому строки в df2 должен будет покрывать каждый день с 01.07.2012 до дня запуска кода.
Дайте мне знать, если я могу внести больше ясности! Я все еще новичок во всем этом, поэтому иногда объяснение проблемы - это половина борьбы!
Я уже пробовал использовать несколько решений, но возраст был совершенно неправильным (проверено по некоторым специальным c excel формулы, которые, как я знаю, верны).