Как найти разницу во времени между строками в группе данных по идентификаторам с помощью панд? - PullRequest
0 голосов
/ 11 ноября 2018

Я новичок в Python и пытаюсь рассчитать разницу во времени между группами. Мне удалось получить разницу.

Датафрейм отредактирован для отображения необходимой информации:

date            id  Type        
2018-11-01 19:24:02 1   Word        
2018-11-01 23:08:59 1   Word        
2018-11-01 23:09:02 1   Command     
2018-11-01 23:09:02 2   Command     
2018-11-01 12:09:02 2   Word    
2018-11-01 23:02:02 3   Command     

Моя цель - получить строки с разницей во времени между ними в 30 секунд в соответствии с идентификатором и перечислить их все. Когда я пытаюсь перечислить их, я теряю 1-ю строку после вычисления длительности

Я получаю что-то вроде этого:

date            id  Type        Diff
2018-11-01 19:24:02 1   Word        00:00:15
2018-11-01 23:08:59 1   Word        00:01:57
2018-11-01 23:09:02 1   Command     01:01:29
2018-11-01 23:09:02 2   Command     01:01:29
2018-11-01 12:09:02 2   Command     01:01:29
2018-11-01 23:02:02 3   Command     01:01:29

Эта 1-я строка в списке - это строка, которая имеет разницу во времени в 15 с с предыдущей, которая не была указана, но я хочу, чтобы это было в списке. Строки с id: 2 должны начинаться с новой разницы во времени в id

Редактировать: Использовать df_Diff = df_sort [(field_df_sort ['Diff']> '0 дней 00:00:00') & (field_df_sort ['Dff'] <'0 дней 00:00:30')] для получения В тех случаях, когда Diff меньше 30 секунд, но не может получить все строки, а также хочет рассчитать разницу для каждого идентификатора, я получаю разницу для всего df </p>

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...