Создайте новые уровни фактора (даты) в соответствии с длиной переменной даты - PullRequest
0 голосов
/ 30 мая 2018

У меня есть фрейм данных (более 100 000 записей с приблизительно 50 переменными), включая переменную даты, которая сохраняется как фактор.Однако длина этой переменной варьируется в зависимости от точности ведения учета.Это занимает длину 0, 4, 6, 8, 9 или 11. Это для:

0: no date; 4: YYYY; 6: MMM-YY; 8: MMM-YYYY; 9: DD-MMM-YY; 11: DD-MMM-YYYY

Я пытаюсь получить все действительные даты (длина 4-9) в том же формате, что и даты длиной 11 (правильный формат).У меня были серьезные проблемы с созданием новой переменной фактора.Например, для записей даты длиной 4, я приму 01_Jul в качестве даты для всех лет.Я попытался расширить текущий набор значений даты:

df$date <- ifelse(df$len==4, as.factor(paste0("01-Jul-", df$date)), df$date)

, но это приводит к числовому значению (даже не к типу символов).Затем я надеюсь использовать аналогичные вменения даты для длин 6, 8 и 9. Есть ли у кого-нибудь какие-либо советы о том, как продвигаться с этими преобразованиями?

Мое последнее намерение - преобразовать факторную переменную в переменную даты, используякоманда as.Date.

Спасибо.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...