Я пробую пакет qwraps2 и некоторые его функции. В частности, меня интересует инструмент summary_table для вывода. Я использую набор данных iris для практики, но я заметил кое-что странное при использовании group_by в summary_table:
library(datasets)
data("iris")
options(qwraps2_markup = "markdown")
our_summary1 <-
list("Sepal Length" =
list("min" = ~ min(iris$Sepal.Length),
"max" = ~ max(iris$Sepal.Length),
"mean (sd)" = ~ qwraps2::mean_sd(iris$Sepal.Length)),
"Sepal Width" =
list("min" = ~ min(iris$Sepal.Width),
"median" = ~ median(iris$Sepal.Width),
"max" = ~ max(iris$Sepal.Width),
"mean (sd)" = ~ qwraps2::mean_sd(iris$Sepal.Width)),
"Petal Length" =
list("min" = ~ min(iris$Petal.Length),
"max" = ~ max(iris$Petal.Length),
"mean (sd)" = ~ qwraps2::mean_sd(iris$Sepal.Length)),
"Petal Width" =
list("min" = ~ min(iris$Petal.Width),
"max" = ~ max(iris$Petal.Width),
"mean (sd)" = ~ qwraps2::mean_sd(iris$Petal.Width)),
"Species" =
list("Setosa" = ~ qwraps2::n_perc0(iris$Species == "setosa"),
"Versicolor" = ~ qwraps2::n_perc0(iris$Species == "versicolor"),
"Virginica" = ~ qwraps2::n_perc0(iris$Species == "virginica"))
)
bytype <- qwraps2::summary_table(dplyr::group_by(iris,Species),our_summary1)
bytype
Вывод, который я получаю: вывод из приведенного выше кода
Это не имеет смысла, это говорит о том, что статистика по различным переменным для разных видов цветов одинакова, а это не так. Я перекрестно проверил это, выполнив:
aggregate(iris[1:4], list(iris$Species), mean)
, который показывает, что, например, среднее значение различных переменных варьируется для разных видов.
Почему dplyr::group_by
не делает то, что должен?
я опубликовал вывод, как мог, извините и спасибо за понимание.