Question

У меня есть pandas DataFrame, который представляет циклы того, что делает пользователь, то есть каждый человек начинает действие, делает много промежуточных шагов и завершает цикл, который я могу определить на основе значения в столбце "процесс Ниже приведен пример:

import pandas as pd


df = pd.DataFrame({
"user": ["Mark", "Mark", "Mark", "Mark", "Mark", "Mark", "Peter", "Peter", "Peter", "Peter"]
, "time": [1, 3, 6, 8, 12, 14, 1, 2, 4, 6]
, "process": ["start", "middle", "end", "start", "end", "start", "start", "end", "start", "middle"]})

Я хотел бы добавить столбец, дающий мне уникальный идентификатор каждого цикла, в простейшей форме это целое число, которое просто подсчитывает циклы. Желаемый результат - как показано ниже:

dfDesiredResult = pd.DataFrame({
"user": ["Mark", "Mark", "Mark", "Mark", "Mark", "Mark", "Peter", "Peter", "Peter", "Peter"]
, "time": [1,3,6, 8,12,14, 1, 2, 4, 6]
, "process": ["start", "middle", "end", "start", "end", "start", "start", "end", "start", "middle"]
, "cycle": [1,1,1,2,2,3,4,4,5,5,]})

Я знал, как это сделать, перебирая строки, но в соответствии с документацией это не рекомендуется (и присвоение значений кажется сложным).

Есть ли простой способ присвоить столбцу «цикл», как описано выше?

Оцените ваши мысли, RaspyVotan

Pandas Dataframe: определение циклов в DataFrame на основе значения в одном столбце

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Pandas Dataframe: определение циклов в DataFrame на основе значения в одном столбце

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы