Как найти схему вхождения событий / букв /? - PullRequest
1 голос
/ 23 июня 2019

У меня есть набор данных событий (в данном случае букв), и я хотел бы выяснить, какие буквы вызвали появление каких букв (например, эта буква всегда всегда c, затем d, затем i).Другими словами, чтобы проверить, есть ли образец и каков образец в появлении тех букв.

set.seed(123) df <- data.frame(x = sample(letters[1:6], 500, replace=TRUE))

1 Ответ

1 голос
/ 23 июня 2019

Из вашего примера кода вы можете попробовать что-то вроде

freqtab <- table(df$x[-length(df$x)], df$x[-1])

, что даст вам полностью (более ранние буквы - это строки, а следующие - столбцы)

freqtab

#     a  b  c  d  e  f
#  a 13 13 19 11 12 13
#  b 17 16 17 10 17 15
#  c 13 16 18 14 17 14
#  d  8 17 16  9  9 13
#  e 20 13 10 13 15 11
#  f 10 16 12 15 13 14

и если вы хотите получить определенную строку, например, частоты букв, следующих за c, вы можете использовать

freqtab["c", ]
#  a  b  c  d  e  f 
# 13 16 18 14 17 14

Есть много других способов подойти к этому

...