Ниже приведены 2 фрагмента кода для сравнения - обратите внимание, что положение фильтра (n ()> = 100) отличается:
library(tidyverse)
library(dslabs)
movielens %>%
group_by(userId) %>%
filter(n() >= 100) %>%
summarise(mean_rating = mean(rating)) %>%
ggplot(aes(mean_rating)) +
geom_histogram(bins=30, col="black")
и
movielens %>%
group_by(userId) %>%
summarise(mean_rating = mean(rating)) %>%
filter(n() >= 100) %>%
ggplot(aes(mean_rating)) +
geom_histogram(bins=30, col="black")
Эти два фрагмента кода дают две разные гистограммы. Почему это так? Разве они не должны делать одно и то же?