Сводить строки в столбцы по дате панды - PullRequest
0 голосов
/ 04 февраля 2019

У меня есть Pandas DataFrame с именем df, который выглядит так:

Date           String

2016-08-01      a
2016-08-01      b
2016-08-01      c
2016-06-30      d
2016-06-30      e
2016-06-30      f

И я пытаюсь получить:

Date           Column1      Column2        Column3

2016-08-01       a             b              c
2016-06-30       d             e              f

Я пытался использовать:

df = pd.pivot_table(df, index='Date')

или:

df.pivot_table(index=['Date'], values="News")

, но я продолжаю получать:

pandas.core.base.DataError: Нет числовых типов для агрегирования

Что мне делать?

Ответы [ 2 ]

0 голосов
/ 04 февраля 2019

Другой способ сделать это - с помощью groupy, apply(list) и после этого преобразовать значения списка в отдельные столбцы с помощью Series.values.tolist()

# Groupby and get the values in a list per unique value of the Date column
df = df.groupby('Date').String.apply(list).reset_index()

    Date        String
0   2016-06-30  [d, e, f]
1   2016-08-01  [a, b, c]

# Convert the values from the list to seperate columns and after that drop the String column
df[['Column1', 'Column2', 'Column3']] = pd.DataFrame(df.String.values.tolist(), index=df.index)
df.drop('String', axis=1, inplace=True)


    Date        Column1 Column2 Column3
0   2016-06-30  d       e       f
1   2016-08-01  a       b       c
0 голосов
/ 04 февраля 2019

Используйте groupby и cumcount, чтобы получить повторяющиеся значения для даты, затем используйте pivot:

(df.assign(Count=df.groupby('Date').cumcount()+1)
   .pivot('Date', 'Count', 'String')
   .add_prefix('Column'))

Count      Column1 Column2 Column3
Date                              
2016-06-30       d       e       f
2016-08-01       a       b       c

Или, set_index и unstack:

(df.set_index(['Date', df.groupby('Date').cumcount()+1])['String']
   .unstack()
   .add_prefix('Column'))

           Column1 Column2 Column3
Date                              
2016-06-30       d       e       f
2016-08-01       a       b       c
...