Учитывая CSV со следующей структурой,
id, postCode, someThing, someOtherThing
1,E3 4AX, cats, dogs
2,E3 4AX, elephants, sheep
3,E8 KAK, mice, rats
4,VH3 2K2, humans, whales
Я хочу создать две таблицы, основываясь на том, является ли значение в столбце postCode
уникальным или нет.Значения других столбцов не имеют значения для меня, но они должны быть скопированы в новые таблицы.
Мои конечные данные должны выглядеть следующим образом: одна таблица основана на уникальных postCode
s:
id, postCode, someThing, someOtherThing
3,E8 KAK, mice, rats
4,VH3 2K2, humans, whales
, а другая - где дублируются postCode
значения
id, postCode, someThing, someOtherThing
1,E3 4AX, cats, dogs
2,E3 4AX, elephants, sheep
Пока я могу загрузить данные, но я не уверен в следующем шаге:
myData <- read.csv("path/to/my.csv",
header=TRUE,
sep=",",
stringsAsFactors=FALSE
)
Новичок в R, поэтому помощь приветствуется.
Данные в формате dput
.
df <-
structure(list(id = 1:4, postCode = structure(c(1L, 1L, 2L, 3L
), .Label = c("E3 4AX", "E8 KAK", "VH3 2K2"), class = "factor"),
someThing = structure(c(1L, 2L, 4L, 3L), .Label = c(" cats",
" elephants", " humans", " mice"), class = "factor"),
someOtherThing = structure(c(1L, 3L, 2L, 4L),
.Label = c(" dogs", " rats", " sheep", " whales "
), class = "factor")), class = "data.frame",
row.names = c(NA, -4L))