соответствующая минимальная поддержка для itemset? - PullRequest
0 голосов
/ 18 июля 2011

Пожалуйста, предложите мне любой материал о соответствующей минимальной поддержке и доверии для набора предметов!

:: Я использую алгоритм apriori для поиска часто встречающихся предметов. я все еще не знаю соответствующей поддержки и уверенности для набора предметов. Я хотел бы знать, какие соображения решить, насколько велика поддержка.

Ответы [ 3 ]

2 голосов
/ 26 апреля 2012

Ответ заключается в том, что соответствующие значения зависят от данных.

Для некоторых наборов данных наилучшее значение может составлять 0,5.Но для некоторых других наборов данных это может быть 0,05.Это зависит от данных.

Но если вы установите minsup = 0 и minconf = 0, некоторым алгоритмам не хватит памяти перед завершением, или вам может не хватить места на диске, потому что шаблонов слишком много.

По моему опыту, лучший способ выбрать minsup и minconf - начать с высокого значения, а затем постепенно понижать их до тех пор, пока вы не найдете достаточно паттернов.

В качестве альтернативы, если вы этого не сделаетеЕсли вы хотите установить minsup, вы можете использовать алгоритмы top-k, где вместо того, чтобы указывать minsup, вы указываете, например, что вы хотите k наиболее часто используемых правил.Например, k = 1000 правил.

Если вас интересует майнинг правил ассоциаций top-k, вы можете проверить мой код Java здесь:

http://www.philippe -fournier-viger.com / spmf /

Алгоритм называется TopKRules, и статья, описывающая его, будет опубликована в следующем месяце.

Кроме того, вам нужно знать, что есть много других интересных мерПомимо поддержки и уверенности: лифт, уверенность в себе, ... Чтобы узнать больше об этом, вы можете прочитать эту статью: «О выборе мер по интересности для правил ассоциации» и «Обзор мер по интересам для правил ассоциации»у мер есть некоторые проблемы в некоторых случаях ... ни одна мера не идеальна.

Надеюсь, это поможет!

0 голосов
/ 14 марта 2012

Минимальные параметры поддержки и минимальной достоверности являются предпочтением пользователя. Если вы хотите большее количество результатов (с меньшей статистической достоверностью), выберите соответствующие параметры. Теоретически вы можете установить их на 0. Алгоритм будет работать, но это займет много времени, и результат не будет особенно полезным , поскольку он содержит практически все.

Так что выбирайте их так, чтобы результат соответствовал вашим потребностям. Математически любое значение является «правильным».

0 голосов
/ 14 марта 2012

В любом алгоритме интеллектуального анализа правил ассоциации, включая Apriori, пользователь сам решает, какие значения поддержки и доверия они хотят предоставить.В зависимости от вашего набора данных и ваших целей вы выбираете minSup и minConf.Очевидно, что если вы установите эти значения ниже, выполнение вашего алгоритма займет больше времени, и вы получите много результатов.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...