Я начал использовать data.table. На самом деле это очень быстрый и довольно приятный синтаксис. У меня проблемы с датами. Мне нравится использовать Lubridate. Во многих моих наборах данных у меня есть даты или даты и время, и я использовал lubridate для манипулирования ими. Lubridate хранит момент как класс POSIX. Я видел ответы здесь, которые создают новые переменные, например, просто чтобы получить год, например. 2005. Мне не нравится это. Временами я буду анализировать по годам, а иногда по кварталам, по месяцам и по продолжительности. Я хотел бы сделать что-то простое, например, это
mydatatable[,length(medical.record.number),by=year(date.of.service)]
, который должен дать мне количество обращений к пациенту за данный год. Функция by не работает.
Error in names(byval) = as.character(bysuborig) :
'names' attribute [2] must be the same length as the vector [1]
Не могли бы вы указать мне виньетки, где data.tables используется с датами и где манипуляции и категоризация этих дат выполняются на лету.