Столбец отсутствует после Pandas GroupBy (не столбец GroupBy) - PullRequest
0 голосов
/ 22 января 2019

Я использую следующий исходный код:

import numpy as np
import pandas as pd


# Load data
data = pd.read_csv('C:/Users/user/Desktop/Daily_to_weekly.csv', keep_default_na=True)

print(data.shape[1])
# 18

# Create weekly data
# Agreggate by calculating the sum per store for every week
data_weekly = data.groupby(['STORE_ID', 'WEEK_NUMBER'], as_index=False).agg('sum')

print(data_weekly.shape[1])
# 17 

Как вы можете видеть по какой-то причине после агрегации отсутствует столбец, и этот столбец не является ни одним из столбцов GroupBy ('STORE_ID', 'WEEK_NUMBER').

Почему это происходит и как я могу это исправить?

1 Ответ

0 голосов
/ 22 января 2019

Я неоднократно сталкивался с этой проблемой.Проблема в том, что panda отбрасывает один из ваших столбцов, потому что он определил его как столбец «неприятностей».Это означает, что объединение, которое вы пытаетесь сделать, не может быть применено к нему.Если вы хотите сохранить этот столбец, я бы рекомендовал включить его в группу.

http://pandas.pydata.org/pandas-docs/stable/groupby.html#automatic-exclusion-of-nuisance-columns

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...