Измените структуру данных panda указанным c способом - PullRequest
0 голосов
/ 14 февраля 2020

Я новичок в Python и хочу изменить структуру данных для дальнейшего анализа. Я хочу изменить таблицу так, чтобы у меня была только одна строка для каждого идентификатора. Я читал, что некоторые библиотеки могут это сделать, но я не знаю, как.

Код для прилагаемого примера выглядит так:

import pandas as pd

data = {'ID': [123, 123], 'Method': ['angular', 'angular'], 'Colour': ['red', 'blue'] }

df = pd.DataFrame (data, columns = ['ID','Method','Colour'])
df

каждая помощь будет по-настоящему оценена

Заранее спасибо

Reshape_data

1 Ответ

0 голосов
/ 14 февраля 2020

unstack ваш друг для такого изменения. Возможный код может быть:

resul = df.reset_index().set_index(['ID', 'Method', 'index']
                                   ).unstack().reset_index()

# clean up the column names
resul.columns = [i if j == '' else i + '_' + str(j)
                 for i, j in resul.columns.tolist()]

Дает, как и ожидалось:

    ID   Method Colour_0 Colour_1
0  123  angular      red     blue
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...