У меня есть набор данных (назовите его df
), который имеет несколько столбцов. Одним из этих столбцов является столбец date
, в котором есть строки вида "d-MON-yy" или "dd-MON-yy" в зависимости от того, является ли номер дня меньше 10 (например, 9-Jan-04,15 октября 98 г.) или NA
. Я пытаюсь изменить это на значения типа даты, но мне нужен только год. В частности, все даты, у которых цифры yy меньше 20, относятся к этому столетию, а все даты, чьи цифры yy больше или равны 20, относятся к 1900-м годам. Я хочу, чтобы в конце были четыре числа года.
Поскольку меня интересует только год, я не против решения, которое возвращает числовые значения.
В концеЯ также хотел бы отфильтровать строки, которые имеют NA
только для date
переменной.
Я довольно плохо знаком с R, и я попытался заставить его работать с несколькими ответами, которые янашел здесь безрезультатно.
Спасибо.