Как проще всего сгруппировать гистограмму, которая рассчитывает среднее значение категории в R? - PullRequest
0 голосов
/ 21 июня 2019

Итак, я импортировал данные центра обработки вызовов из CSV-файла в R.

flows = read.csv("data.csv")

Для меня есть два важных столбца:

  1. имя
  2. продолжительность

Я пытаюсь создать гистограмму, которая вычисляет среднюю продолжительность вызова для группы, которая делится на имя переменной. По сути, диаграмма показывает, какие типы вызовов имеют наибольшую среднюю продолжительность.

Есть также около 50 различных имен, так что, если бы я мог ограничить диаграмму топ-5/10, это было бы идеально. Извините, если это простая проблема, заранее благодарю за любую помощь.

1 Ответ

0 голосов
/ 21 июня 2019

Это должно работать

   flows %>%
        group_by(name) %>%
        dplyr::summarize(Mean = mean(duration, na.rm=TRUE))

После этого вы, вероятно, захотите отсортировать его по продолжительности и сохранить 5 первых значений.

flows<-flows[order(flows$Mean),]
flows<-flows[5,]
...