Манипуляции с фреймами данных: работа с переменными - PullRequest
0 голосов
/ 01 мая 2019

У меня есть фрейм данных под названием «Bycountry», например:

Страны Нордерс 1 Алжир 1 2 Франция 2 3 Тунис 3 4 Алжир 4 5 Аллемань 5 6 Франция 6

Я хочу сделать статистику на этом фрейме данных:

  • в столбце страны, сводка стран (без дубликатов)
  • в столбце чисел, сумма по странам

Я уже установил plyr и dplyr пакеты, так что я знаю, что должен использовать mutate(), summarise(), group_by(), но я не знаю, в каких или как.

   Otherbycountry <- data.frame(
          Countries = c("Algerie", "France", "Tunisie", "Algerie", 
          "Allemagne", "France"),
           Norders = c(1 , 2 , 3, 4, 5, 6))

Текущий результат - 1x1 тиббл с общей суммой чисел.

1 Ответ

1 голос
/ 05 мая 2019

Код

library(dplyr)
Otherbycountry %>% 
    # grouping by country
    group_by(Countries) %>% 
    # sum of Norders column (for each group) 
    summarise(Norders_sum = sum(Norders)) %>% 
    # ungroup
    ungroup()
  • Введите ?group_by, ?summarise и ?group_by в R для получения дополнительной информации о функциях.
  • Прочтите раздел о сгруппированных резюме ( R для Data Science Гарретта Гролемунда и Хэдли Уикхема ) для получения более подробной информации.

выход

# # A tibble: 4 x 2
# Countries Norders_sum
# <fct>           <dbl>
# 1 Algerie             5
# 2 Allemagne           5
# 3 France              8
# 4 Tunisie             3
...