Я использую pandas для преобразования столбца с датой и временем в секунды, используя следующий код:
df['date_time'] = pd.to_timedelta(df['date_time'])
df['date_time'] = df['date_time'].dt.total_seconds()
Набор данных:
Если я использую следующий код:
df['date_time'] = pd.to_datetime(df['date_time'], errors='coerce')
df['date_time'] = df['date_time'].dt.total_seconds()
print(df.head())
Тогда я получаю следующую ошибку:
AttributeError: 'DatetimeProperties' object has no attribute 'total_seconds'
Так же, как и в случае с dt.timestamp
Итак, мои запросыявляются:
Нужно ли переводить время в секунды для тренировки модели?Если да, то как и если нет, то почему?
Этот столбец связан с двумя другими столбцами с именами weather_m и weather_d , weather_m имеет 38разные типы записей, или, скажем, 38 разных категорий, из которых только одна будет верна за раз, а у weather_m - 11, но случай такой же, как и у weather_m.Так что я немного запутался, стоит ли разделить эти категориальные данные и объединить 49 новых столбцов в исходном наборе данных, добавив в них weather_m и weather_d для обучения модели или использовать LabelEncoder вместо pd.get_dummies?