Power BI - R Сценарий Визуальный - Априори - PullRequest
0 голосов
/ 29 октября 2018

Я использую визуальный скрипт r в PowerBI. Я могу запустить приведенный ниже код в R, и он работает, но я получаю ошибку ниже при работе в PowerBI. Я хочу показать результаты от apriori наглядно. Оба нижеприведенных теста отлично работают в R, но НЕ в визуальном сценарии R из PowerBI Есть мысли?

если я попробую # test2.

library(Matrix)
library(arules)
library(plyr)
library(gridExtra)

df_itemList <- ddply(dataset,c("SALESID"),function(df1)paste(df1$ITEMID))
#test1
#df_itemList  = sapply(df_itemList , function(x) gsub(" ", ",", x))
#basket_rules <- apriori(df_itemList, parameter = list(sup=0.1,conf=0.5,target="rules", maxlen=5));

#test2
txn = read.transactions(df_itemList, rm.duplicates = TRUE, format = "basket", sep = ",", cols = 1);
basket_rules <- apriori(txn, parameter = list(sup=0.1,conf=0.5,target="rules", maxlen=5));

df_basket <- as(basket_rules,"data.frame")
grid.table(df_basket)

Сообщение об ошибке: Ошибка сценария R.

Комплектация: «arules»

Следующие объекты маскируются из 'package: base':

abbreviate, write

Ошибка в readLines (файл, кодировка = кодировка): «con» не является соединением Звонки: read.transactions -> lapply -> readLines Исполнение остановлено

Если я попробую # test1 ...

library(Matrix)
library(arules)
library(plyr)
library(gridExtra)

df_itemList <- ddply(dataset,c("SALESID"),function(df1)paste(df1$ITEMID))
#test1
df_itemList  = sapply(df_itemList , function(x) gsub(" ", ",", x))
basket_rules <- apriori(df_itemList, parameter = list(sup=0.1,conf=0.5,target="rules", maxlen=5));

#test2
#txn = read.transactions(df_itemList, rm.duplicates = TRUE, format = "basket", sep = ",", cols = 1);
#basket_rules <- apriori(txn, parameter = list(sup=0.1,conf=0.5,target="rules", maxlen=5));

df_basket <- as(basket_rules,"data.frame")
grid.table(df_basket)

Тогда я получаю ошибку ниже.

Сообщение об ошибке: Ошибка сценария R.

Прилагаемый пакет: «arules»

Следующие объекты маскируются из 'package: base':

abbreviate, write

Ошибка в asMethod (объект): столбец (ы) 2, 3, 4 не логично или фактор. Сначала дискретизируйте столбцы. Звонки: apriori -> as -> asMethod Исполнение остановлено

1 Ответ

0 голосов
/ 29 октября 2018

Правильный способ использования read.transactions в скрипте PowerBI R состоит в преобразовании кадра данных в матрицу, а затем в класс транзакций. Это чтобы передать экспорт в CSV, а затем прочитать обратно в read.transactions ... Ссылка здесь

library(Matrix)
library(arules)
library(plyr)
library(dplyr)
library(gridExtra)

itemList <- dataset
#itemList <- read.csv("ItemListAll.csv", header=TRUE, sep=",")

# Converting to a Matrix ####
itemList$const = TRUE

# Remove duplicates
dim(itemList)
orders <- unique(itemList)
dim(itemList)

# Need to reshape the matrix
itemList_max_prep <- reshape(data = itemList,
                           idvar = "SALESID",
                           timevar = "ITEMID",
                           direction = "wide")

# Drop the SALESID
itemList_matrix <- as.matrix(itemList_max_prep[,-1])

# Clean up the missing values to be FALSE
itemList_matrix[is.na(itemList_matrix)] <- FALSE

# Clean up names
colnames(itemList_matrix) <- gsub(x=colnames(itemList_matrix),
                               pattern="const\\.", replacement="")

itemList_trans <- as(itemList_matrix,"transactions")

#inspect(itemList_trans)

basket_rules <- apriori(itemList_trans, parameter = list(sup=0.01,conf=0.5,target="rules", minlen=3));
df_basket <- as(basket_rules,"data.frame")
df_basket$support <- ceiling(df_basket$support * 100)
df_basket$confidence<- ceiling(df_basket$confidence * 100)
df_basket$lift<- round(df_basket$lift, digits = 2)
df_basket <- df_basket[rev(order(df_basket$support)),];
grid.table(head(df_basket));
...