Как создать таблицу числового подсчета из двух переменных, эквивалентных ggplot + geom_count (), используя sumrize ()? - PullRequest
0 голосов
/ 18 мая 2019

The black dots represent count number. Because the dot size is not clear, a table with numerical values is desirable.

ggplot(data, aes(x, y))+ geom_count()

предоставляет график, показывающий счет каждого случая [x, y]. Если бы было 4 значения в x и 6 значений в y, geom_count показывал бы 24 круга на графике, и каждый размер круга представлял бы счет.

Как мне создать таблицу подсчета двух переменных аналогично, используя summarise() или любую другую функцию в dplyr? Эта таблица будет показывать количество как число, а не размер круга, как в geom_count () для каждого случая [x, y].

1 Ответ

0 голосов
/ 18 мая 2019

Добро пожаловать в stackoverflow. Исходя из ваших комментариев, я думаю, что-то вроде того, что вы ищете:

library(tidyverse)

df <-
  mpg %>% 
  mutate(
    x = cyl,
    y = drv
  )


df %>% 
  # create a column called n for number of times x & y occur together
  count(x, y) %>% 
  # create columns for each unique value of y and 
  # put the values of column n below
  spread(key = y, value = n, fill = 0) 

#     x   `4`     f     r
# ------------------------
#     4    23    58     0
#     5     0     4     0
#     6    32    43     4
#     8    48     1    21

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...