Я использую R и у меня есть набор данных, где каждый столбец является производственной единицей, а каждая строка - единицей времени. Каждая переменная представляет собой последовательность севооборота, применяемую к производственной единице.
Набор данных выглядит следующим образом:
land_use_1 land_use_2 land_use_3 land_use_4 land_use_5 land_use_6
<chr> <chr> <chr> <chr> <chr> <chr>
1 PAST PAST PAST PAST SOY PAST
2 PAST PAST PAST PAST SOY PAST
3 PAST PAST PAST PAST PAST PAST
4 PAST PAST PAST PAST PAST SOY
5 PAST PAST PAST PAST CORN SOY
6 PAST PAST PAST PAST CORN PAST
Мне нужно проверить, сколько из этих столбцов (последовательностей кадрирования) являются уникальными, я не могу сделать это один за другим (делая что-то вроде land_use_1! = land_use_2, делая что-то вроде land_use_1! = land_use_3 и т. д. c), потому что в наборе данных есть сотни столбцов.
Я пытался использовать эта команда
dataset %>% unique(, MARGIN=2) %>% dim()
, но возвращает то же количество столбцов набора данных и, следовательно, не определяет, какие столбцы идентичны (я знаю, что некоторые идентичны, потому что я проверил, используя некоторые из них).
Как я могу сделать это эффективным способом?
Спасибо