Частые последовательные паттерны - PullRequest
0 голосов
/ 27 февраля 2019

Каков наилучший способ получить последовательный шаблон для таких данных в R:

enter image description here

Идея состоит в том, чтобы получить частоту буквв процессах 1,2 и 3. Есть ли функция GSP, которая может это сделать?Любое понимание или учебник приветствуется.

1 Ответ

0 голосов
/ 27 февраля 2019

вы можете использовать комбо apply и table (при условии, что вы читаете свои данные в R):

dat <- data.frame(process1 = c('A', 'B', 'A', 'A', 'C'), process2 = c('B', 'C', 'B', 'B', 'A'), process3 = c('C', 'C', 'A', 'B', 'B'))
apply(dat, 2, table)
#  process1 process2 process3
#A        3        1        1
#B        1        3        2
#C        1        1        2

apply перебирает столбцы dat (это то, что аргумент2 относится к) и применяется table к каждому, что подсчитывает каждый уникальный элемент.см. справочные страницы для семейства функций *apply для получения дополнительной информации.

Решение db выше, lapply(dat, table), делает то же самое, но возвращает список, а не матрицу.

...