Может кто-нибудь сказать мне, как переставить / упорядочить последовательные образцы с одинаковыми наборами предметов, но в разных порядках в R?
Я применил cSPADE для примера набора данных Zaki. И моя цель состоит в том, чтобы переставить столбец последовательности (3917 строк), чтобы строки с одинаковыми наборами элементов следовали друг за другом во фрейме данных. Смотрите:
install.packages(c('dplyr', 'tidyverse', 'arulesSequences', 'arules', 'Matrix'))
library(dplyr)
library(tidyverse)
library(arulesSequences)
library(arules)
library(Matrix)
zaki = read_baskets(con=system.file("misc", "zaki.txt", package = "arulesSequences"), info = c("sequenceID", "eventID", "SIZE"))
frequent_pattern <- cspade(zaki, parameter = list(support = 0.20))
frequent_pattern <- as(frequent_pattern, "data.frame")
Часть вывода:
#Two examples of sequences with the same item sets but different orders in df frequent_pattern
sequence support
14 <{G},{H}> 0.25
144 <{H},{G}> 0.25
3296 <{A},{A,B},{C}> 0.25
3344 <{A,B},{A},{C}> 0.25
3862 <{C},{A,B},{A}> 0.25
В желаемом выводе есть строки с одинаковыми наборами элементов, следующих друг за другом в столбце последовательности:
sequence support
2 <{G},{H}> 0.25
3 <{H},{G}> 0.25
5 <{A},{A,B},{C}> 0.25
6 <{A,B},{A},{C}> 0.25
7 <{C},{A,B},{A}> 0.25
Большое спасибо за усилия заранее