Я работаю с данными вида в наборе формата присутствия / отсутствия, где образцы брались несколько раз в день в течение нескольких дней.
Вот фиктивная версия данных:
dummy = structure(list(Sample = c("A1", "A1", "A1", "A2", "A2", "A2",
"B1", "B1", "B1", "B2", "B2", "B2"), Species = c("snuffles1",
"snuffles2", "snuffles3", "snuffles1", "snuffles2", "snuffles3",
"snuffles1", "snuffles2", "snuffles3", "snuffles1", "snuffles2",
"snuffles3"), Presence = c(1, 0, 0, 1, 1, 0, 0, 1, 1, 1, 1, 1
), Day = c("A", "A", "A", "A", "A", "A", "B", "B", "B", "B",
"B", "B")), row.names = c(NA, -12L), class = c("tbl_df", "tbl",
"data.frame"))
ggplot(dummy[which(dummy$Presence>0),], aes(x = Day, y = Species, color = Species)) +
geom_point(alpha=0.5) +
geom_count(aes(size = sum(dummy$Presence)))
Я хотел бы построить данные в ggplot, где размер каждой точки зависит от суммы числа наблюдения внутри этой группы (т. е. если бы в день А нюхатели 1 наблюдались 2 раза, то точка должна быть размером 2, тогда как если бы в день В нюхатели 1 наблюдались один раз, то точка была бы размером 1). Я надеюсь это имеет смысл? Этот подсчет присутствия / отсутствия на основе группы похож, но не совсем то, что мне нужно.
Я предполагаю, что мне нужно использовать какую-то функцию для подсчета количества наблюдений для каждого вида, в зависимости от того, какую переменную я рассматриваю, но я не настолько умен, чтобы думать, как это сделать. .
Спасибо за любые советы.
![enter image description here](https://i.stack.imgur.com/v2S7w.jpg)