Создайте df, который содержит имя столбца и соответствующее значение другого кадра данных - PullRequest
0 голосов
/ 02 октября 2018

Я создал следующий фрейм данных с именем df

       col1  col2  col3
    0     4     5     2
    1     5     2     4
    2     3    10     3
    3     6     2     2
    4     3     2     4 

Теперь мне хотелось бы перевернуть строки так, чтобы df выглядел следующим образом:

         column_name  value
    0        col1      4
    1        col2      5
    2        col3      2
    3        col1      5
    4        col2      2
    5        col3      4
   ...       ...      ...

IЯ думаю, что мне нужно использовать stack () , но я не уверен, как.Я пробовал следующее

df = df.stack().rename_axis(['column_name']).reset_index(name = 'value')

, но это возвращает следующую ошибку

raise ValueError('Length of names must match number of levels in '
ValueError: Length of names must match number of levels in MultiIndex.

Вопрос: как мне сложить значения так, чтобы я получил желаемыйdataframe

Ответы [ 2 ]

0 голосов
/ 02 октября 2018

Если порядок строк не важен, вы можете использовать pd.melt напрямую:

res = pd.melt(df, var_name='column_name')

Если вы хотите упорядочить по строкам ввода, вы можете использовать pd.melt с reset_index, чтобы повысить индекс до серии, а затем использовать sort_values:

res = pd.melt(df.reset_index(), id_vars='index', var_name='column_name')\
        .sort_values('index').drop('index', 1).reset_index(drop=True)

print(res)

   column_name  value
0         col1      4
1         col2      5
2         col3      2
3         col1      5
4         col2      2
5         col3      4
6         col1      3
7         col2     10
8         col3      3
9         col1      6
10        col2      2
11        col3      2
12        col1      3
13        col2      2
14        col3      4
0 голосов
/ 02 октября 2018

Здесь необходимо удалить первый уровень MultiIndex, используя reset_index с drop=True:

df = (df.stack()
        .reset_index(level=0, drop=True)
        .rename_axis(['column_name'])
        .reset_index(name = 'value'))
print (df)
   column_name  value
0         col1      4
1         col2      5
2         col3      2
3         col1      5
4         col2      2
5         col3      4
6         col1      3
7         col2     10
8         col3      3
9         col1      6
10        col2      2
11        col3      2
12        col1      3
13        col2      2
14        col3      4

Другое решение - melt изменен порядок значений:

df = df.melt(var_name='column_name')
print (df)
   column_name  value
0         col1      4
1         col1      5
2         col1      3
3         col1      6
4         col1      3
5         col2      5
6         col2      2
7         col2     10
8         col2      2
9         col2      2
10        col3      2
11        col3      4
12        col3      3
13        col3      2
14        col3      4
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...