Группировка по совпадению символов и длине строки - PullRequest
0 голосов
/ 18 апреля 2019

Предположим, у меня есть столбец в кадре данных со строками.Я хочу создать метод группировки, чтобы длина строки соответствовала, а затем соответствовал символу строки, чтобы признать ее как определенную группу.

Выходные данные должны быть сгруппированы, как показано в примере ниже:

Rule                      Group
x                           1
x                           1
xx                          2
xx                          2
xy                          3
yx                          3
xx                          2
xyx                         4
yxx                         4
yyy                         5
xyxy                        6   
yxyx                        6
xyxy                        6

1 Ответ

2 голосов
/ 18 апреля 2019

Вы можете разделить Rule, отсортировать и вставить обратно. Сопоставление результата с уникальным результатом даст вам то, что вам нужно. В R

v1 <- sapply(strsplit(df$Rule, ''), function(i)paste(sort(i), collapse = ''))
match(v1, unique(v1))
#[1] 1 1 2 2 3 3 2 4 4 5 6 6 6
...