уникальные значения в категориальных переменных R estudio - PullRequest
0 голосов
/ 15 апреля 2020

Как узнать, сколько уникальных значений принимает каждое категориальное в фрейме данных, а затем представить его в виде графика? все это в R studio

1 Ответ

0 голосов
/ 15 апреля 2020

Здесь мы будем использовать tidyverse.

library(tidyverse)

Вы можете применить функцию unique () к фрейму данных, чтобы удалить любые повторяющиеся строки.

df <- iris %>% unique()

Функции group_by (), sumrize () и n () позволяют подсчитать количество экземпляров переменной в кадре данных.

df2 <- df %>% group_by(Species) %>% summarise(n = n())

## alternatively use count() which does the same thing
df2 <- df %>% count(Species)

Наконец, мы можем использовать Пакет ggplot для создания графика.

ggplot() + geom_col(data = df2, aes(x = Species, y = n))

Если вас не интересует отдельный фрейм данных с данными в нем, и вы хотите перейти прямо к графику, вы можете игнорировать этот шаг с помощью group_by () и обобщить () и просто использовать geom_bar ().

ggplot() + geom_bar(data = df, aes(Species))
...