Пакет R arules: формат файла read.transactions - PullRequest
0 голосов
/ 30 декабря 2018

У меня есть файл .csv со следующими типами данных:

Day Item
1 12,19,24,31,48,
1 1,19,
1 16,28,32,45,
1 19,36,41,43,44,
1 7,24,27,
1 21,31,33,41,
1 46
1 50
2 12,31,36,48,
2 17,29,47,
2 2,18,20,29,38,39,40,41
2 17,29,47,

И я не могу заставить read.transactions правильно его прочитать.

Набор данныхна основе нескольких пунктов выбора для каждого дня (более одного раза в день, если необходимо).Например, третий выбор в 1-й день вернул пункты 16, 28, 32 и 45.

Разве этого не достаточно?

library(arules)
dataset <- read.transactions("file.csv", format = 'basket')

1 Ответ

0 голосов
/ 31 декабря 2018

Я попытался создать пример данных, используя предоставленные вами данные

data <- read.table(text="Day Item
1 12,19,24,31,48,
1 1,19,
1 16,28,32,45,
1 19,36,41,43,44,
1 7,24,27,
1 21,31,33,41,
1 46
1 50
2 12,31,36,48,
2 17,29,47,
2 2,18,20,29,38,39,40,41
2 17,29,47",header = T)

data <- as(data[-1], "transactions") ##removing 1st header column for the transactional data

inspect(data)

## apply apriori algorithm ###

rules <- apriori(data, parameter = list(supp = 0.001, conf = 0.80))


### Arrange top 10 rules by lift ####

inspect(rules[1:10])

Пожалуйста, попробуйте этот метод, надеюсь, он поможет

...