Создание нового df с количеством переменных из другого df - PullRequest
0 голосов
/ 23 ноября 2018

У меня есть простой фрейм данных с одним столбцом, «полными датами».

enter code here

Я хотел бы создать новый фрейм данных с каждым днемв одном столбце, а затем создайте другой столбец с именем count, в котором записывается, сколько раз этот день был введен в мой старый фрейм данных.Таким образом, этот фрагмент данных будет преобразован в:

enter code here

Ответы [ 2 ]

0 голосов
/ 24 ноября 2018

В итоге это сработало:

df = dates_cleaned.sort_values(by=['full dates'], ascending=True)

df = pd.DataFrame(df['full dates'].value_counts().reset_index())

df = df.sort_values(by=['index'], ascending=True)

df = df.rename(columns={'index': 'full dates', 'full dates': 'count'})
0 голосов
/ 23 ноября 2018

Использование -

df['full dates'].value_counts()

Для вашего случая использования (если это так просто) вы можете рассматривать каждую дату как категориальную переменную.

Это произведет вывод в отсортированном порядке (по убыванию) по наибольшему количеству.Используйте параметр sort=False для поддержания исходного порядка

Если вы ищете более надежное решение на основе date, сначала проанализируйте столбец с помощью pd.to_datetime() -

df['full dates'] = pd.to_datetime(df['full dates'], format='%m/%d/%y')

Затем используйтеpd.Grouper() на групповую дату, чтобы получить ежедневный счетчик дат -

df.groupby(pd.Grouper(key='full dates', freq='D')).count()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...