Принимая среднее значение date_times - PullRequest
0 голосов
/ 26 сентября 2019

У меня есть набор данных, к которому я прикрепил образец.Моя цель - найти среднее время, необходимое для завершения каждого процесса.Я использую следующий код:

import pandas as pd
df = pd.read_csv(....)
df['Start Time']=pd.to_datetime(df['Start Time'])
df['Finish Time']=pd.to_datetime(df['Finish Time'])
df['Process'] = df['Process'].astype("category")
df['Duration'] = df['Finish Time']-df['Start Time']
sectors = df.groupby('Process')
sectors['Duration'].mean()

Однако всякий раз, когда я запускаю код, я получаю следующую ошибку:

Нет числовых типов для агрегирования

Любая помощь будет оценена.

Файл = https://filebin.net/0698p6q9or49ctw6/bb.csv?t=77zhetpd

PS: 1. Вот результат Когда я использовал dt.days:

A 0,5

B 0,0

C 0,0

Но я ищу что-то вроде этого:

Среднее A = 16,54305554 часов

Среднее B = 0,67 часа

Среднее C = 1,37 часа

1 Ответ

0 голосов
/ 26 сентября 2019

Я использую следующий код, и он работал:

df['Duration'] = (df['Duration']/np.timedelta64(1,'D'))*24
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...