Как я могу различить значения счетчика в столбце в R - PullRequest
1 голос
/ 24 апреля 2020

У меня есть что-то вроде этого:

# A tibble: 24,288 x 1

Country/Region

Афганистан
Албания
Алжир
Андорра
Ангола
Антигуа и Барбуда Аргентина
Армения
Австралия
Австралия

... с 24 278 строками

Как подсчитать различные значения в этом столбце?

Ответы [ 2 ]

1 голос
/ 24 апреля 2020

Мы можем использовать count от dplyr

library(dplyr)
df1 %>%
   count(`Country/Region`)
0 голосов
/ 24 апреля 2020

Вот решение sqldf:

textFile <- "Country_Region
Afghanistan
Albania
Algeria
Andorra
Angola
Antigua and Barbuda Argentina
Armenia
Australia
Australia"

data <- read.csv(text = textFile,stringsAsFactors = FALSE)
library(sqldf)
sqldf("select count(distinct Country_Region) from data")

... и результат:

> sqldf("select count(distinct Country_Region) from data")
  count(distinct Country_Region)
1                              8
> 
...