- Я использую R apriori (библиотека (arules)) для получения правил. хотите, чтобы все правила, имеющие rhs (справа), относились к списку товаров (не только одному)
Я помещаю информацию о сегментации клиентов и product_name также в «product»
затем использовать продукт создать раздел и правила
тогда я надеюсь иметь правила, в которых rhs содержит только product_name, но у меня может быть сегментирование в lhs.
Надеюсь получить предложение, не способное достичь с помощью функции apriori (, appearence = (list (rhs = ...)))
и прекрасный странный результат описать в задаче 2. как следует
- выяснить, могу ли я дать список дольше, например, c («цельное молоко», «злаки», «другие овощи», «рис», «фирменный сыр», «варенье»)
имеет меньше правил (3042), чем только наличие c («цельное молоко», «злаки», «другие овощи») (3077), поэтому не уверен, почему и как понять функцию appearence = (list (rhs = ...))
Моя первоначальная проблема - нелегко создать восстанавливаемый код (чтение данных из базы данных напрямую), но здесь есть некоторые различия;
с набором данных по каждому разрезу на клиента (корзина / имя_продукта):
cust1 яблочно-грушевые чипсы
cust2 молочное яблочное вино
....
для каждого клиента также есть тег сегментации (профиля)
Cust1 20-30 Famle Gold
cust2 30-40 мужской сивер
...
тогда я объединил сегментацию и профиль
20-30 яблок с яблочной грушей
30-40 мужчин сивер молоко молоко победа
...
затем используйте это преобразование данных для "пересечения" для функции arule apporiori и получите некоторые правила
например. {20-30, Famle, яблоко} => {вино}
{мужчина, вино} => {30-40}
но меня интересовали только правила для rhs с названием продукта (груша, чипсы, яблоко но не 30-40, мужской, золото)
поэтому я пытаюсь использовать функцию apriori (, appearence = (list (rhs = product_items))) для достижения
Я создаю список символов с именем product_items <-data <code>[tag=='product_name']
как только я найду 0 правил. Я попытался на некоторое время, а затем выяснить, странная вещь, если я только использую
product_item[1:10]
Я получил 30000 правил, если увеличить до
product_item[1:80]
количество правил уменьшено до 200 ...
мы можем использовать data(Groceries)
в качестве примера,
pro <-c("whole milk", "cereals","other vegetables", "rice", "specialty cheese", "jam")
lp<- c("whole milk", "cereals","other vegetables")
r2<- apriori (Groceries,
parameter = list(supp = 0.001, conf = 0.5),
appearance = list(rhs = pro)
)
r1 <- apriori (Groceries,
parameter = list(supp = 0.001, conf = 0.5),
appearance = list(rhs = lp)
)
тогда для summary(r2)
у нас есть 3042 правила, но для summary(r1)
у нас есть 3077 правил
так что это заставляет меня усомниться в моем понимании функции apriori (, appearence = (list (rhs = ....))). Я думал, что если я создам список символов или вектор product_name, у меня будет больше товаров, а это значит, у меня будет больше правил. потому что это означает, что у меня будут любые правила, у которых положено (rhs), совпадающее с любым именем продукта, которое я положил в функцию.
но увеличение элемента int product_name сокращает количество правил, поэтому я могу подвергнуть сомнению мое понимание.
было бы неплохо иметь любое ваше объяснение
И мне все еще нужно выяснить, все ли правила, относящиеся к rhs, могут быть любыми или с элементом в product_name, какие-нибудь предложения, как его изменить?
говорят, что я хочу, чтобы все правила соответствовали моим требованиям supp, conf, а также в rhs содержались слова "(цельное молоко", "хлопья", "другие овощи", "рис", "фирменный сыр", "варенье" «)
как мне это сделать?
спасибо!