У меня есть набор данных, такой как приведенный ниже, за исключением около 5 миллионов наблюдений.Я уже отфильтровал даты, основанные на времени, когда они были записаны в предыдущем коде, чтобы включить только звонки, сделанные в рабочее время.Теперь я хочу разделить даты на основе WORKERCALL_ID, чтобы увидеть список всех уникальных дат для каждого работника и количество раз, которое каждый WORKERCALL_ID отображается на каждую дату (количество вызовов на дату, разделенных каждым WORKERCALL_ID.Я попытался сделать это, используя матрицу непредвиденных обстоятельств, а затем изменив ее на фрейм данных, но файл настолько велик, что мой сеанс R. всегда прерывается. У кого-нибудь есть идеи, как это сделать?
WORKERCALL_ID DATE
124789244 02-01-2014
128324834 05-01-2014
124184728 06-10-2014
Ниже приведен пример желаемого вывода для каждого идентификатора WORKERCALL_ID и даты. Моя конечная цель - иметь возможность установить поднабор результата и удалить строки / идентификаторы с высокой частотой вызовов.
WORKERCALL_ID DATE FREQ
124789244 02-01-2014 4
124789244 02-23-2014 1