Question

У меня есть pandas фрейм данных, который имеет повторяющиеся идентификаторы, поскольку каждая строка представляет собой меру времени.

 pd.DataFrame([[1, 2], [1, 3], [2, 6], [2,7]], columns=['id', 'colA'])

Я хочу преобразовать его таким образом, чтобы каждая строка представляла один идентификатор, и Временной ряд данных данных фиксируется в новых столбцах. Т.е. я хочу, чтобы вывод выглядел так:

pd.DataFrame([[1,2,3],[2,6,7]],columns=["id","colA_0","colA_1"])

Как мне этого добиться?

jezrael · Answer 1 · 25 февраля 2020

Используйте GroupBy.cumcount для счетчика, создайте MultiIndex с помощью DataFrame.set_index и измените его на Series.unstack:

df1 = (df.set_index(['id', df.groupby('id').cumcount()])['colA']
         .unstack()
         .add_prefix('colA_')
         .reset_index())
print (df1)
   id  colA_0  colA_1
0   1       2       3
1   2       6       7

Группировка pandas строк по идентификатору, создание новых столбцов для записей времени

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Группировка pandas строк по идентификатору, создание новых столбцов для записей времени

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов