У меня есть data.frame, представляющий табель рабочего времени для нескольких сотрудников в течение нескольких месяцев, охватывающих 2 года. Данные выглядят так:
Name Month 1 2 3 ... 31 Total Job ... [more columns]
John Smith Aug 2017 1:20 1:20 Typing
Mary Jones Sep 2017 Prooing
John Smith Oct 2017 0:15 1:10 1:25 Typing
...
Jim Miles Feb 2018 1:30 2:10 3:40 Admin
Есть 31 столбец, каждый из которых представляет дату в соответствующем месяце. Там будет несколько строк с одним и тем же именем.
Итак, глядя на первую запись, Джон Смит проделал 1 час 20 минут работы 1 августа 2017 года.
Что я хочу сделать, так это проанализировать эти данные детально, например,
- Сколько часов Джон Смит потратил на набор текста в сентябре 2017 года?
- Сколько проверок было проведено в январе-феврале 2018 года?
Я немного застрял в том, как поступить, чтобы получить данные для анализа. Предложения приветствуются.
Добавлено для уточнения:
Прочитав три очень полезных ответа и посмотрев на tidyr
, я прояснил свои мысли и подумал, что мне нужно изменить данные, чтобы в каждой записи была одна строка, поэтому пример таблицы станет:
Name Date Duration Job ... [more columns]
John Smith 01 Aug 2017 1:20 Typing
John Smith 02 Oct 2017 0:15 Typing
John Smith 31 Oct 2017 0:15 Typing
...
Jim Miles 02 Feb 2018 1:30 Admin
Jim Miles 03 Feb 2018 2:10 Admin
Дата должна быть правильно отформатирована, но это не главное. Проблема заключается в сопоставлении дня месяца с соответствующим месяцем и годом для получения составной даты. Любые идеи приветствуются.