Консолидация кадра данных для построения линейного графика в R - PullRequest
0 голосов
/ 15 апреля 2020

У меня есть таблица частот, описывающая длины, которые я хотел бы построить в виде линейного графика, предпочтительно используя ggplot2. Но в таблице 13373 наблюдения, что затрудняет построение всех точек. Таким образом, есть ли способ, которым я могу объединить график с меньшим количеством наблюдений, чтобы получить хорошо выглядящий график.

Заголовок кадра данных

  Length Freq
1  151    1
2  152    1
3  159    1
4  168    2
5  174    1
6  177    1

Сводка переменной длины:

 Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
    151    1692    4624    9795    9921  834300 

Я в основном ищу сюжет, похожий на этот line chart

Большое спасибо, Карти c K

1 Ответ

1 голос
/ 15 апреля 2020

Да, вы можете! Длина гена в основном представляет собой числовую переменную, поэтому вы можете разбивать / разбивать ее на группы и агрегировать следующим образом:

df %>%
mutate(Length_bin = cut(Length, breaks = 100) %>%
groub_by(Length_bin) %>%
summarise(Freq = sum(Freq))

Вы можете определить количество разрывов или ввести точки вырезания вручную.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...