Как интерпретировать результаты правила ассоциации Mlxtend - PullRequest
0 голосов
/ 18 июня 2020

Я использую mlxtend, чтобы найти правила ассоциации:

Вот код:

df = apriori(dum_data, min_support=0.4, use_colnames=True)
rules = association_rules(df, metric="lift", min_threshold=1)
rules2=rules[ (rules['lift'] >= 1) & (rules['confidence'] >= 0.7) ]

Вывод:

antecedents             consequents    antecedentsupport    consequentsupport   support confidence  lift      leverage  conviction
frozenset({'C'})        frozenset({'B'})        0.63        0.705                   0.45    0.726   1.030       0.013   1.077
frozenset({'A'})        frozenset({'B'})        0.98        0.705                   0.69    0.70    1.003       0.0007  1.00081
frozenset({'A', 'C'})   frozenset({'B'})        0.63        0.705                   0.45    0.72    1.030       0.013   1.0776

Я дал min support=0.4. В чем разница между antecedentsupport, consequentsupport и support?

Что означает lift and leverage? Как определить, хорошо это или плохо?

Уверенность Я могу это понять сколько раз C и B встречались вместе для первого правила в выводе. ? Это правильно

1 Ответ

1 голос
/ 21 июня 2020

Давайте возьмем для примера третье правило ({A, C} => {B}):

support = поддержка {A, B, C} | поддержка означает, что вы подсчитываете количество транзакций, которые содержат все три из {A, B, C}, и делите его на общее количество транзакций.

antecedentupport = поддержка того, что предшествует =>, означает поддержку of {A, C}

conquentsupport = поддержка того, что следует после =>, означает поддержку {B}

уверенность = насколько вероятно, что после того, как мы наблюдали {A, C } что тракция дополнительно содержит {B}. Подумайте об этом как об условной вероятности p (B при условии {A, C}).

Lift: определение подъемника можно, например, найти здесь: wikipedia . Это означает, что если лифт <1, то {A, C} и {B} встречаются реже, чем ожидалось. Если рост больше единицы, то {A, C} и {B} появляются вместе чаще, чем ожидалось. </p>

Кредитное плечо примерно одинаково. Он также сравнивает ожидаемое совпадение и наблюдаемое. Дальнейшее объяснение, например, здесь

То, что делает хороший подъем / кредитное плечо, субъективно, но я бы предложил подъем> 1. Если дело касается правил, я бы больше обратил внимание на уверенность.

...