Добавление дубликатов данных в одну запись - PullRequest
0 голосов
/ 13 апреля 2019

У меня есть многоиндексные данные по району, году и месяцу, за которые были зарегистрированы убийства.Я пытаюсь организовать свой фрейм данных таким образом, чтобы для строк существовал многоиндексный список, по району и году, а затем данные столбца представляли собой месяцы.

Моя проблема заключается в том, что, как в настоящее время организовано, в столбце месяца содержатся повторяющиеся значения, поскольку записываются отдельные убийства.Так, например, в данном районе в 2008 году может быть 3 заявки на марш, поскольку здесь произошло три отдельных убийства. Pic of my dataframe

То, чего я хочу добиться, - это иметь несколькоиндексируйте информационный фрейм с городом и годом в качестве индексов, а месяцы в качестве заголовков столбцов и соответствующими значениями в качестве значений.Как можно суммировать значения в столбце значений, чтобы общее значение за данный месяц было всеми убийствами, совершенными в этом месяце, например, в сентябре 2016 года, как у меня есть одна запись за сентябрь со значением 2?

1 Ответ

0 голосов
/ 15 апреля 2019

Попробуйте сгруппировать:

df['value'].groupby(['borough', 'year', 'month']).sum()
...