В R: Порядок строк (последовательных шаблонов) с одинаковыми наборами элементов, но в другом порядке - PullRequest
0 голосов
/ 10 марта 2020

Может кто-нибудь сказать мне, как переставить / упорядочить последовательные образцы с одинаковыми наборами предметов, но в разных порядках в R?

Я применил cSPADE для примера набора данных Zaki. И моя цель состоит в том, чтобы переставить столбец последовательности (3917 строк), чтобы строки с одинаковыми наборами элементов следовали друг за другом во фрейме данных. Смотрите:

install.packages(c('dplyr', 'tidyverse', 'arulesSequences', 'arules', 'Matrix'))
library(dplyr)
library(tidyverse)
library(arulesSequences)
library(arules)
library(Matrix)

zaki = read_baskets(con=system.file("misc", "zaki.txt", package = "arulesSequences"), info = c("sequenceID", "eventID", "SIZE"))
frequent_pattern <- cspade(zaki, parameter = list(support = 0.20))
frequent_pattern <- as(frequent_pattern, "data.frame")

Часть вывода:

    #Two examples of sequences with the same item sets but different orders in df frequent_pattern
        sequence        support
14      <{G},{H}>       0.25
144     <{H},{G}>       0.25

3296    <{A},{A,B},{C}> 0.25
3344    <{A,B},{A},{C}> 0.25
3862    <{C},{A,B},{A}> 0.25

В желаемом выводе есть строки с одинаковыми наборами элементов, следующих друг за другом в столбце последовательности:

        sequence        support
2       <{G},{H}>       0.25
3       <{H},{G}>       0.25

5       <{A},{A,B},{C}> 0.25
6       <{A,B},{A},{C}> 0.25
7       <{C},{A,B},{A}> 0.25

Большое спасибо за усилия заранее

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...