Pandas Dataframe: определение циклов в DataFrame на основе значения в одном столбце - PullRequest
0 голосов
/ 02 марта 2020

У меня есть pandas DataFrame, который представляет циклы того, что делает пользователь, то есть каждый человек начинает действие, делает много промежуточных шагов и завершает цикл, который я могу определить на основе значения в столбце "процесс Ниже приведен пример:

import pandas as pd


df = pd.DataFrame({
"user": ["Mark", "Mark", "Mark", "Mark", "Mark", "Mark", "Peter", "Peter", "Peter", "Peter"]
, "time": [1, 3, 6, 8, 12, 14, 1, 2, 4, 6]
, "process": ["start", "middle", "end", "start", "end", "start", "start", "end", "start", "middle"]})

Я хотел бы добавить столбец, дающий мне уникальный идентификатор каждого цикла, в простейшей форме это целое число, которое просто подсчитывает циклы. Желаемый результат - как показано ниже:

dfDesiredResult = pd.DataFrame({
"user": ["Mark", "Mark", "Mark", "Mark", "Mark", "Mark", "Peter", "Peter", "Peter", "Peter"]
, "time": [1,3,6, 8,12,14, 1, 2, 4, 6]
, "process": ["start", "middle", "end", "start", "end", "start", "start", "end", "start", "middle"]
, "cycle": [1,1,1,2,2,3,4,4,5,5,]})

Я знал, как это сделать, перебирая строки, но в соответствии с документацией это не рекомендуется (и присвоение значений кажется сложным).

Есть ли простой способ присвоить столбцу «цикл», как описано выше?

enter image description here

Оцените ваши мысли, RaspyVotan

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...