Поскольку разница между значениями 1959
для 19:59 и 2000
для 20:00 в основном составляет всего 1 минуту, вы теряете этот контекст, используя такой тип представления данных.Например, ваша модель поймет, что разница между этими двумя примерами такая же, как разница между 1900
и 1941
, что совсем не то, что вы планируете.
Я могуматематически не докажу вам, что это приведет к ошибкам в вашей тренировочной модели, но это очень плохая практика.Если возможно, я бы преобразовал во что-то еще, что более равномерно, например, минуты с 00:00 (полночь):
def time_converter(time_str):
hours = int(time_str[:2])
minutes = int(time_str[2:])
time_since_midnight = (hours * 60) + minutes
return time_since_midnight
time_converter('1940') # will return 1180 integer for 1180 minutes since midnight
Делайте это, конечно, постоянно в ваших данных, чтобы избежать искажения информации