Я пытаюсь подсчитать количество различных имен из набора данных в R, используя пакет sqldf, и хотел проверить мой ответ, используя tidy. Я получил немного другой ответ и не мог понять, что его вызвало. Вот мой код:
mayors <- read_csv(file="https://raw.githubusercontent.com/jmontgomery/jmontgomery.github.io/master/PDS/Datasets/Mayors.csv")
mayorsDF <- as.data.frame(mayors)
library(sqldf)
sqldf("select count(distinct FullName) from mayorsDF") # gives me 1406
allNamesDF <- sqldf("select distinct FullName from mayorsDF")
length(allNamesDF$FullName) # gives me 1407
library(tidyverse)
mayors %>%
select("FullName") %>%
unique() %>%
count() # gives me 1407
Что мне не хватает? Я новичок в пакете sqldf, но не новичок в SQL.