У меня проблема с моим фреймом данных последовательности. Пример кадра данных показан ниже здесь. Я хочу найти наиболее важные последовательности (порядок в последовательности имеет значение):
1,left,right,forward,back
2,forward,left,right,back,left,right
3,left,left,right,right
4,forward,left
5,left,right,forward,back,back,right,right,back,back
Я читаю эти данные в R, используя этот код:
data <- read.transactions(data='pathmydata',
format='basket',
sep='c',
cols=c(1),
rm.duplicates = F)
Мне удается получать частые предметы (например, с eclat или apriori). Однако для алгоритма cspade пакета arulesSequence также требуется sequenceID. Что хорошо, подумал я, поскольку я определил это с помощью функции cols = c (1) в приведенном выше коде. Я называю это так:
cspade(data = data,
parameter = list(support = 0.8, maxlen=5, minlen=2, maxgap=1))
Это приводит к следующей ошибке:
Error in cspade(data = data, paremeter = list(support = 0.8, maxlen=5, :
transactionInfo: missing 'sequenceID'and/or eventID'.
Однако я понятия не имею, как сказать функции cspade, что первый столбец здесь - это идентификатор последовательности. Кто-нибудь знает это? Я также не знаю, как сказать функции, что у меня нет идентификатора события (или они совпадают с sequenceID и eventID?).