Если ваше поле REQ_TIME было всегда 6 цифр, то есть всегда было заполнено нулями влево и вправо, это становится намного проще. Например, вы можете использовать gsub
, чтобы просто взять первые два символа.
Или, если он всегда был дополнен нулями справа (т. Е. Добавлено «00» секунд при отсутствии), и он был импортирован как числовое полеВы можете разделить на 10000 и использовать floor
.
(см. http://h2o -release.s3.amazonaws.com / h2o / rel-turchin / 5 / docs-website / h2o-py / docs / frame.html для операций, доступных на H2OFrames, из Python API.)
Но в вашем случае я бы скачал этот столбец, выполнил сложные манипуляции в python, а затем импортировал new H2O Кадр, содержащий только этот столбец. Дайте ему имя столбца "hours"
. Затем используйте cbind
, чтобы присоединить новый столбец к существующему фрейму h2o.
(Другой способ решения этой проблемы состоит в том, что первая строка вашего вопроса является неточной, поскольку это не такФормат "hhmmss", но на самом деле представляет собой сочетание "hmm", "hhmm", "hmmss" и "hhmmss", все вместе в одном столбце. Как только вы это описали, вы видите, что у вас есть проблема с данными. ЛичноЯ хотел бы попытаться исправить это в момент сбора данных. Затем, если вы когда-нибудь увидите метку времени, которая не совсем 6 цифр, вы сразу узнаете, что у вас неверные данные.)