Общая разница во времени (в миллисекундах) между строками относительно поля столбца - PullRequest
0 голосов
/ 26 июня 2018

Я хотел бы рассчитать разницу во времени / временную разницу между строками моей системы мониторинга транспортных средств.У меня есть в общей сложности 700 тысяч строк данных, которые включают в себя такие поля, как:

Индекс, метка времени, широта, долгота, модель транспортного средства

В моих данных 7 различных моделей

На данный момент я могу вычислять разницу во времени для отдельных строк, используя код, показанный ниже:

 mydataset['timestamp'] = pd.to_datetime(mydataset["timestamp"], format = 
 "%Y-%m-%d %H:%M:%S")
 mydataset['timedelta'] = (mydataset['timestamp'] - 
 mydataset['timestamp'].shift().fillna(pd.to_datetime("00:00:00", 
 format="%H:%M:%S")))

С помощью этого кода я могу найти разницу во времени.Но сейчас я хочу, чтобы это было отфильтровано для каждой модели автомобиля.Прямо сейчас я могу только рассчитать различия в каждом ряду.Но некоторые ряды состоят из разных моделей.Могу ли я позволить ему «взглянуть» на модель транспортного средства и выполнить расчет?

Например, данные

1,x,2018-05-16 09:14:37.343,0 days 00:00:05.000000000
2,x,2018-05-16 09:14:42.343,0 days 00:00:05.000000000
3,x,2018-05-16 09:14:47.343,0 days 00:00:05.000000000
4,x,2018-05-16 09:14:52.344,0 days 00:00:05.001000000
5,x,2018-05-16 09:14:57.344,0 days 00:00:05.000000000
6,y,2018-05-16 09:15:02.344,0 days 00:00:05.000000000
7,y,2018-05-16 09:15:07.344,0 days 00:00:05.000000000
8,y,2018-05-16 09:15:12.344,0 days 00:00:05.000000000
9,x,2018-05-16 09:15:17.344,0 days 00:00:05.000000000
10,x,2018-05-16 09:15:22.345,0 days 00:00:05.001000000

Обновление!Как показано ниже, код, который помогает мне сгруппировать модель автомобиля.Хотел бы попросить методы для суммирования разницы во времени каждой модели!

mydataset['new'] = mydataset.groupby('Model').timestamp.diff()

1 Ответ

0 голосов
/ 26 июня 2018

Просто groupby модель и взять diff()

>>> df.groupby('model').timestamp.diff()
...