какую команду я могу использовать для удаления повторяющихся значений? - PullRequest
1 голос
/ 24 апреля 2020

Спокойной ночи, у меня есть такой файл

City Lat   Long  Mals 
Bog 1m2sS 05M34W 2000 
Bog 1m2sS 05M34W 2000 
Bog 1m2sS 05M34W 3500 
Bog 6m3sS 10M34W 3400

Я хочу получить файл, подобный следующему:

City Lat   Long  Mals
Bog 1m2sS 05M34W 2000
Bog 1m2sS 05M34W 3500
Bog 6m3sS 10M34W 3400

Спасибо за вашу помощь

Ответы [ 2 ]

2 голосов
/ 24 апреля 2020

Мы можем использовать unique из base R

unique(df1)
#  City   Lat   Long Mals
#1  Bog 1m2sS 05M34W 2000
#3  Bog 1m2sS 05M34W 3500
#4  Bog 6m3sS 10M34W 3400

данные

df1 <- structure(list(City = c("Bog", "Bog", "Bog", "Bog"), Lat = c("1m2sS", 
"1m2sS", "1m2sS", "6m3sS"), Long = c("05M34W", "05M34W", "05M34W", 
"10M34W"), Mals = c(2000L, 2000L, 3500L, 3400L)),
class = "data.frame", row.names = c(NA, 
-4L))
2 голосов
/ 24 апреля 2020

Было бы полезно получить больше информации, например, пример ваших данных.

Вы можете использовать пакет janitor для выявления повторяющихся ответов:

library(janitor)
library(dplyr)

# Get all duplicates
df %>% get_dupes()

# Get duplicates for a specified variable
df %>% get_dupes(var_name)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...