Как мне выбрать первые 84 строки моей x категориальной переменной (открытой), чтобы вычислить среднее значение моей непрерывной переменной y, используя r? - PullRequest
0 голосов
/ 19 октября 2019

Я пытался использовать функцию средних значений, а также сводку. Я также попробовал tapply и попытался выбрать строки, но он вычисляет общее среднее значение.

1 Ответ

0 голосов
/ 19 октября 2019

Как-то так?

library(tidyverse)

data <- tibble(
  x = factor(c("A", "B", "C")) %>% sample(100, replace = TRUE),
  y = rnorm(100)
)

data
#> # A tibble: 100 x 2
#>    x          y
#>    <fct>  <dbl>
#>  1 B     -0.271
#>  2 C     -0.361
#>  3 C      1.17 
#>  4 A     -0.652
#>  5 A      0.770
#>  6 C     -0.605
#>  7 B      0.976
#>  8 B      0.392
#>  9 B      1.08 
#> 10 A      0.548
#> # ... with 90 more rows

head_means <- 
  head(data, 84) %>% 
  group_by(x) %>% 
  summarize_at("y", mean) %>% 
  ungroup()

head_means
#> # A tibble: 3 x 2
#>   x          y
#>   <fct>  <dbl>
#> 1 A      0.132
#> 2 B      0.385
#> 3 C     -0.110

Создано в 2019-10-19 годах представительным пакетом (v0.3.0)

Не стесняйтесь включать это или вариант этого в свой вопрос.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...