У меня есть датафрейм со столбцами; идентификатор_пользователя, дата транзакции и сумма транзакции. Это вопрос, состоящий из двух частей: 1. Как обновить значения столбца datetime на основе значений в диапазоне datetime 2. Как манипулировать кадром данных, чтобы иметь временные ряды с уникальными идентификаторами клиентов, где значения trans_amount назначаются соответствующим дата и идентификатор клиента
Я попытался создать массив равных интервалов времени и затем обновить значения в столбце trans_date до новой метки, если дата была до одной из дат в диапазоне:
data['trans_date'] = pd.to_datetime(data['trans_date'])
date_range = pd.date_range(start = data['trans_date'].min() ,end = data['trans_date'].max(), periods=16,freq = None)
for i, row in df.iterrows():
for x in range(16):
for j in data.at[i,'trans_date']:
if j<=date_range[x]:
copy.at[i,'trans_date']=date_range[x]
Я не уверен, работает ли этот код, поскольку он слишком медленный для запуска на моем устройстве. Кроме того, я не знаю, как бы я продолжил с этого, поскольку я не нашел способа установить значения столбцов в datetime и индексировать значения для идентификаторов клиентов, не теряя информацию trans_amount (например, переключается на nan).