Почему итоговое суммирование дает неправильный результат, если точка используется в аргументе формулы? - PullRequest
0 голосов
/ 19 сентября 2019

Итак, я столкнулся со следующей проблемой:

df = data.frame(...) # with columns "Article" & "Revenue"
df_agg = aggregate(.~ Article, data = df, sum)
# Let A be some Article
sum_1 = sum(df$Revenue[df$Article == A], na.rm=T)
sum_2 = sum(df_agg$Revenue[df_agg$Article == A], na.rm=T)

Я бы ожидал, что sum_1 == sum_2 - это правда, но это не так.Почему это может быть?Проблема исчезает, если я не использую точку в аргументе формулы, а вместо этого Revenue ~ Article.Но почему?

...