Объединение нескольких значений строк в одном столбце на основе частоты другого значения в R - PullRequest
1 голос
/ 23 февраля 2020

Я хочу разместить большой набор данных на основе частоты переменных в столбце A. Переменные в столбце B исчезнут, потому что я не использую их в подмножестве. Однако я хочу сохранить их, чтобы добавить дополнительную информацию о частоте переменной в столбце A.

Пример данных

A   B
A1  2001 
A1  2005
A1  2010
B2  2001
B3  2005
B3  2010

Результат требуется:

A  Freq  B
A1  3    2001, 2005, 2010
B2  1    2001
B3  2    2005, 2010

Я использую функцию table для создания таблицы частот, но я не могу понять, как добавить столбец с годами, разделенными каким-либо разделителем.

1 Ответ

4 голосов
/ 23 февраля 2020

вы можете использовать dplyr для этого:

df <- data.frame(
  A= c("A1", "A1", "B2", "B3", "B3"),
  B = c(2001,2005,2010,2001,2005)
)

library(dplyr)

df %>% group_by(A) %>% 
  summarise(count = n(), year = paste(B, collapse = ","))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...