Apriori Rhs имеет несколько продуктов - PullRequest
2 голосов
/ 10 апреля 2019
  1. Я использую R apriori (библиотека (arules)) для получения правил. хотите, чтобы все правила, имеющие rhs (справа), относились к списку товаров (не только одному)

Я помещаю информацию о сегментации клиентов и product_name также в «product» затем использовать продукт создать раздел и правила тогда я надеюсь иметь правила, в которых rhs содержит только product_name, но у меня может быть сегментирование в lhs.

Надеюсь получить предложение, не способное достичь с помощью функции apriori (, appearence = (list (rhs = ...)))

и прекрасный странный результат описать в задаче 2. как следует

  1. выяснить, могу ли я дать список дольше, например, c («цельное молоко», «злаки», «другие овощи», «рис», «фирменный сыр», «варенье») имеет меньше правил (3042), чем только наличие c («цельное молоко», «злаки», «другие овощи») (3077), поэтому не уверен, почему и как понять функцию appearence = (list (rhs = ...))

Моя первоначальная проблема - нелегко создать восстанавливаемый код (чтение данных из базы данных напрямую), но здесь есть некоторые различия;

с набором данных по каждому разрезу на клиента (корзина / имя_продукта): cust1 яблочно-грушевые чипсы cust2 молочное яблочное вино ....

для каждого клиента также есть тег сегментации (профиля) Cust1 20-30 Famle Gold cust2 30-40 мужской сивер ...

тогда я объединил сегментацию и профиль 20-30 яблок с яблочной грушей 30-40 мужчин сивер молоко молоко победа ...

затем используйте это преобразование данных для "пересечения" для функции arule apporiori и получите некоторые правила

например. {20-30, Famle, яблоко} => {вино} {мужчина, вино} => {30-40}

но меня интересовали только правила для rhs с названием продукта (груша, чипсы, яблоко но не 30-40, мужской, золото)

поэтому я пытаюсь использовать функцию apriori (, appearence = (list (rhs = product_items))) для достижения Я создаю список символов с именем product_items <-data <code>[tag=='product_name']

как только я найду 0 правил. Я попытался на некоторое время, а затем выяснить, странная вещь, если я только использую product_item[1:10] Я получил 30000 правил, если увеличить до product_item[1:80] количество правил уменьшено до 200 ...

мы можем использовать data(Groceries) в качестве примера,

pro <-c("whole milk", "cereals","other vegetables", "rice", "specialty cheese", "jam")
lp<- c("whole milk", "cereals","other vegetables")

r2<- apriori (Groceries, 
                  parameter = list(supp = 0.001, conf = 0.5),
                  appearance = list(rhs = pro)
                  ) 

r1 <- apriori (Groceries, 
                  parameter = list(supp = 0.001, conf = 0.5),
                  appearance = list(rhs = lp)
                  ) 

тогда для summary(r2) у нас есть 3042 правила, но для summary(r1) у нас есть 3077 правил так что это заставляет меня усомниться в моем понимании функции apriori (, appearence = (list (rhs = ....))). Я думал, что если я создам список символов или вектор product_name, у меня будет больше товаров, а это значит, у меня будет больше правил. потому что это означает, что у меня будут любые правила, у которых положено (rhs), совпадающее с любым именем продукта, которое я положил в функцию. но увеличение элемента int product_name сокращает количество правил, поэтому я могу подвергнуть сомнению мое понимание. было бы неплохо иметь любое ваше объяснение

И мне все еще нужно выяснить, все ли правила, относящиеся к rhs, могут быть любыми или с элементом в product_name, какие-нибудь предложения, как его изменить?

говорят, что я хочу, чтобы все правила соответствовали моим требованиям supp, conf, а также в rhs содержались слова "(цельное молоко", "хлопья", "другие овощи", "рис", "фирменный сыр", "варенье" «)

как мне это сделать? спасибо!

...