У меня есть данные от 50 различных датчиков, выборка которых не синхронизирована. Они обычно записывают данные каждые 10 минут, но есть также аномалии, когда они производят выборку с более высокой частотой и пропускают данные.
Я пытаюсь повторить выборку данных, например, с интервалом в 10 минут [10:00 10 : 10 10:20 .. 11:00].
Сначала я пытаюсь добавить это время в индекс, а затем интерполировать их значения. Найдите фрагмент кода ниже.
import pandas as pd
df = pd.read_csv("C:\Sensors Data\\" + "Temperature_Sensor_1" +".csv")
df['Date'] = pd.to_datetime(df['Date'], format = '%m/%d/%Y %I:%M %p')
df = df.set_index('Date')
df.asfreq(freq='10M')
df.to_csv("Test" + ".csv", index=False, encoding='utf-8-sig')
Но при попытке повторной выборки я получил следующую ошибку.
Файл "C: \ ProgramData \ Anaconda3 \ lib \ site- packages \ pandas \ core \ indexes \ base.py ", строка 3099, в _can_reindex повысить значение ValueError (" невозможно переиндексировать с дублированной оси ")
ValueError: невозможно переиндексировать с повторяющейся оси
Найдите ниже образец данных.