У меня есть простая проблема, но я не уверен, как заставить это работать.
У меня есть набор данных, в котором записываются температуры устройств:
Device_ID Temperature Label
1 50 0
1 40 0
2 34 0
1 78 0
2 66 1
3 88 0
1 12 0
2 33 0
3 91 0
Устройства могут отправлять температуру в любое время. Приведенный выше набор данных уже отсортирован по времени.
Что я хочу сделать?
Классифицируйте устройства на основе их температурного режима.
У меня уже есть метки для набора данных, метки указывают, испортились ли устройства после измерения (1 означает, что после этого измерения устройство вышло из строя, 0 означает, что все в порядке).
Если устройство выходит из строя, его ярлык теперь всегда плохой -> т.е. мне понадобятся только значения временных рядов до этой точки. Теперь устройство помечено как плохое, и будущие измерения не имеют значения.
Итак, я хочу построить классификационный набор данных как:
Device_ID T1 T2 T3 T4 ... Tn Label
1 50 40 78 ... 0
2 34 66 ..... 1 (33 measurement now does not matter)
Итак, мой вопрос как преобразовать эти значения временных рядов в строках в столбцы в Pandas? Как выполнить эту задачу эффективно ?
Я могу использовать Pivot, но Pivot работает только для категориальных переменных.
Любая помощь очень ценится.