У меня есть фрейм данных с 500k строк и около 130 столбцов. Я хочу отфильтровать повторяющиеся строки для всех столбцов, кроме одного (столбец 128). Я попробовал:
df <- unique(df[,-128])
df <- df[!duplicated(df[, -128])]
df <- distinct(df, -column128)
Я получаю одну и ту же ошибку снова и снова:
Error in paste(..............., : formal argument "sep" matched by multiple actual arguments
Я также пытался напечатать каждый столбец, но получил ту же ошибку. Если я попробую выше для первых 9 столбцов, ошибка не появится. Однако, если я попробую то же самое для 10 столбцов, я получу ошибку. Есть ли ограничение на количество столбцов для удаления дублированных строк? Или есть у кого решение?
df выглядит следующим образом (столбец 128 = метка):
data.frame': 571262 obs. of 139 variables:
$ x : num 1 1 1 1 0 0 0 7 7 7 ...
$ jan : num 0 0 0 0 0 0 0 0 0 0 ...
$ feb : num 0 0 0 0 0 0 0 0 0 0 ...
$ mrt : num 0 0 0 0 0 0 0 0 0 0 ...
$ apr : num 0 0 0 0 0 0 0 0 0 0 ...
$ mei : num 0 0 0 0 0 0 0 0 0 0 ...
$ jun : num 0 0 0 0 0 0 0 0 0 0 ...
$ jul : num 0 0 0 0 0 0 0 0 0 0 ...
$ aug : num 1 1 0 0 0 0 0 0 0 0 ...
$ sep : num 0 0 1 1 0 0 0 0 0 0 ...
$ okt : num 0 0 0 0 1 1 1 0 0 0 ...
$ nov : num 0 0 0 0 0 0 0 1 1 1 ...
$ dec : num 0 0 0 0 0 0 0 0 0 0 ...
$ - 1 : num 0 0 1 1 1 ...
$ - 2 : num 0 0 0 0 1 ...
$ - 3 : num 0 0 0 0 0 ...
$ - 4 : num 0 0 0 0 0 0 0 0 0 0 ...
......
$ - 114 : num 0 0 0 0 0 0 0 0 0 0 ...
$ label : int 8 12 8 12 8 10 12 8 10 12 ...
$ 2008 : num 0 0 0 0 0 0 0 0 0 0 ...
$ 2009 : num 0 0 0 0 0 0 0 0 0 0 ...
$ 2010 : num 0 0 0 0 0 0 0 0 0 0 ...
$ 2011 : num 0 0 0 0 0 0 0 0 0 0 ...
$ 2012 : num 0 0 0 0 0 0 0 0 0 0 ...
$ 2013 : num 0 0 0 0 0 0 0 0 0 0 ...
$ 2014 : num 0 0 0 0 0 0 0 0 0 0 ...
$ 2015 : num 0 0 0 0 0 0 0 0 0 0 ...
$ 2016 : num 1 1 1 1 1 1 1 1 1 1 ...
$ 2017 : num 0 0 0 0 0 0 0 0 0 0 ...
$ 2018 : num 0 0 0 0 0 0 0 0 0 0 ...