У меня есть pandas DataFrame, который представляет циклы того, что делает пользователь, то есть каждый человек начинает действие, делает много промежуточных шагов и завершает цикл, который я могу определить на основе значения в столбце "процесс Ниже приведен пример:
import pandas as pd
df = pd.DataFrame({
"user": ["Mark", "Mark", "Mark", "Mark", "Mark", "Mark", "Peter", "Peter", "Peter", "Peter"]
, "time": [1, 3, 6, 8, 12, 14, 1, 2, 4, 6]
, "process": ["start", "middle", "end", "start", "end", "start", "start", "end", "start", "middle"]})
Я хотел бы добавить столбец, дающий мне уникальный идентификатор каждого цикла, в простейшей форме это целое число, которое просто подсчитывает циклы. Желаемый результат - как показано ниже:
dfDesiredResult = pd.DataFrame({
"user": ["Mark", "Mark", "Mark", "Mark", "Mark", "Mark", "Peter", "Peter", "Peter", "Peter"]
, "time": [1,3,6, 8,12,14, 1, 2, 4, 6]
, "process": ["start", "middle", "end", "start", "end", "start", "start", "end", "start", "middle"]
, "cycle": [1,1,1,2,2,3,4,4,5,5,]})
Я знал, как это сделать, перебирая строки, но в соответствии с документацией это не рекомендуется (и присвоение значений кажется сложным).
Есть ли простой способ присвоить столбцу «цикл», как описано выше?
Оцените ваши мысли, RaspyVotan