Условный символ Столбец ffdf data - PullRequest
0 голосов
/ 03 мая 2019

Я импортировал большой набор данных (~ 6 миллионов строк) в R, используя пакет ffbase, в котором перечислены люди, поступившие в среднюю школу в Бразилии.В принципе, у меня есть 2 столбца: Id (Идентификационный номер студента) и Университет (название учебного заведения).

Я хотел бы создать столбец с названием «Группа» в моем примере, который связывает каждый университет с его образовательной группой:

Id           University       Group
000001       Anhanguera       Kroton
000002       Unopar           Kroton
000003       Anhembi          Laureate
000004       FMU              Laureate

PS: у меня нет информации об образовательных группах в моем наборе данных, но у меня есть информация, которая мне нужна, относительно того, какая группа соответствует каждому вузу.Таким образом, мне нужно прикрепить эту деталь к моим данным.

PS2: класс университетского столбца - ff_vector.

Я ценю любой вклад, который вы могли бы внести.

1 Ответ

0 голосов
/ 03 мая 2019

Если у вас длинный список групп, это может быть не самый быстрый способ, но, используя mutate из пакета dplyr :

data <- data.frame("Id" = 000001:000004, "University" = c("Anhanguera", "Unopar", "Anhembi", "FMU"))

data <-  mutate(data, Group = as.factor(
    ifelse(University %in% "Anhanguera", "Kronton", 
        ifelse(University %in% "Unopar", "Kronton",
            ifelse(University %in% "Anhembi", "Laureate",
                ifelse(University %in% "FMU", "Laureate", NA))))))        
data
str(data)

Я использовал Университет здесь, но просто замените его на ff_vector.

Если вы хотите сохранить Группу как символ, удалите as.factor().

Я не знаком с ffbase, но посмотрите ffbase2 для использования dplyr и ffbase.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...