Как я могу пересэмплировать этот Dataframe? - PullRequest
1 голос
/ 19 марта 2019

Я пытаюсь повторно сэмплировать предстоящий DF для последующего создания Lag Features.

Mi_Meteo.head()


  Sensor ID   Time Instant    Measurement
0   14121   2013/11/14 17:00    0.8
1   14121   2013/11/14 18:00    0.6
2   14121   2013/11/14 19:00    0.4
3   14121   2013/11/14 20:00    0.4
4   14121   2013/11/14 21:00    0

Итак, вот что я сделал:

Mi_Meteo = Mi_Meteo.set_index(['Time Instant']) # to Make The Time Instant as an Index

И затем:

Mi_Meteo.index = pd.to_datetime(Mi_Meteo.index) #  to convert it to a DateTimeIndex

Но я получаю эту ошибку:

Unknown string format

Зная, что я хочу получить DF как этот (с временным диапазоном 3H)

    Time Instant         Sensor ID          Measurement
0   2013/11/14 00:00:00    14121                0.8
1   2013/11/14 03:00:00    14121                0.6
2   2013/11/14 06:00:00    14121                0.4
3   2013/11/14 09:00:00    14121                0.4
4   2013/11/14 12:00:00    14121                 0

Спасибо всем.

1 Ответ

0 голосов
/ 19 марта 2019

Имеются некоторые неверные данные, преобразуйте их в NaN s с помощью параметра errors='coerce':

Mi_Meteo.index = pd.to_datetime(Mi_Meteo.index, errors='coerce')

При необходимости проверьте следующие строки:

print (Mi_Meteo[pd.to_datetime(Mi_Meteo.index, errors='coerce').isna()])
...