Минимальная уверенность и минимальная поддержка Apriori - PullRequest
3 голосов
/ 05 января 2010

Каковы подходящие значения для минимальной достоверности и минимальных значений поддержки для алгоритма Apriori ? Как вы могли бы настроить их? Это фиксированные значения или они меняются во время работы алгоритма? Если вы использовали этот алгоритм раньше, какие значения вы использовали?

Ответы [ 2 ]

8 голосов
/ 07 января 2010

Я бы предложил начать со значений 0,05 для поддержки и 0,80 для уверенности. Но я согласен с тем, что вы должны понимать, что именно они представляют, чтобы иметь возможность определить их соответствующим образом. Для правила A => B (где A, B непустые множества)

Support (A ⇒ B): s = P(A, B)
Confidence (A ⇒ B): c = P(B | A)
Lift (A ⇒ B): L = c/P(B)

Подъем важен для оценки интереса правила (потому что вы обычно придумываете их сотни). Было предложено более двадцати мер интереса. К ним относятся Ф-коэффициент, каппа, взаимная информация, J-мера и индекс Джини. Я лично заказываю свои правила в соответствии с J-мерой.

J.measure (A ⇒B): J = s/c * (c*log(L) + (1-c)*log((L-c)/L))
2 голосов
/ 27 марта 2012

Вы должны установить значения minsup и minconf перед запуском алгоритма, и они не меняются в процессе майнинга.

Выбор параметров minsup зависит от ваших данных.

Для некоторых данных я использую 80%. Для некоторых других данных я использую 0,05%. Все зависит от набора данных. Обычно я начинаю с высокого значения, а затем уменьшаю значения, пока не найду значение, которое сгенерирует достаточно паттернов.

Для уверенности, это немного проще, потому что оно представляет уверенность, которую вы хотите в правилах. Поэтому обычно я использую что-то вроде 60%. Но это также зависит от данных.

Кроме того, если вы не хотите использовать параметры minsup, вы можете использовать алгоритм майнинга top-k. В этом случае вы будете указывать, например, k = 1000, а алгоритм обнаружит, например, 1000 правил вместо использования minsup. Я разработал один такой алгоритм для майнинга правил ассоциации. Он называется TopKRules, и вы загружаете исходный код . Документ, описывающий это, будет опубликован в ближайшее время. Он использует только два параметра: k и minconf.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...