Преобразование кадра данных транзакции во временные ряды с агрегированными значениями идентификаторов - PullRequest
0 голосов
/ 03 марта 2020

У меня есть датафрейм со столбцами; идентификатор_пользователя, дата транзакции и сумма транзакции. Это вопрос, состоящий из двух частей: 1. Как обновить значения столбца datetime на основе значений в диапазоне datetime 2. Как манипулировать кадром данных, чтобы иметь временные ряды с уникальными идентификаторами клиентов, где значения trans_amount назначаются соответствующим дата и идентификатор клиента

Я попытался создать массив равных интервалов времени и затем обновить значения в столбце trans_date до новой метки, если дата была до одной из дат в диапазоне:

data['trans_date'] = pd.to_datetime(data['trans_date'])
date_range = pd.date_range(start = data['trans_date'].min() ,end = data['trans_date'].max(), periods=16,freq = None)

for i, row in df.iterrows():
    for x in range(16):
        for j in data.at[i,'trans_date']:
            if j<=date_range[x]:
                copy.at[i,'trans_date']=date_range[x]

Я не уверен, работает ли этот код, поскольку он слишком медленный для запуска на моем устройстве. Кроме того, я не знаю, как бы я продолжил с этого, поскольку я не нашел способа установить значения столбцов в datetime и индексировать значения для идентификаторов клиентов, не теряя информацию trans_amount (например, переключается на nan).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...