Ответ заключается в том, что соответствующие значения зависят от данных.
Для некоторых наборов данных наилучшее значение может составлять 0,5.Но для некоторых других наборов данных это может быть 0,05.Это зависит от данных.
Но если вы установите minsup = 0 и minconf = 0, некоторым алгоритмам не хватит памяти перед завершением, или вам может не хватить места на диске, потому что шаблонов слишком много.
По моему опыту, лучший способ выбрать minsup и minconf - начать с высокого значения, а затем постепенно понижать их до тех пор, пока вы не найдете достаточно паттернов.
В качестве альтернативы, если вы этого не сделаетеЕсли вы хотите установить minsup, вы можете использовать алгоритмы top-k, где вместо того, чтобы указывать minsup, вы указываете, например, что вы хотите k наиболее часто используемых правил.Например, k = 1000 правил.
Если вас интересует майнинг правил ассоциаций top-k, вы можете проверить мой код Java здесь:
http://www.philippe -fournier-viger.com / spmf /
Алгоритм называется TopKRules, и статья, описывающая его, будет опубликована в следующем месяце.
Кроме того, вам нужно знать, что есть много других интересных мерПомимо поддержки и уверенности: лифт, уверенность в себе, ... Чтобы узнать больше об этом, вы можете прочитать эту статью: «О выборе мер по интересности для правил ассоциации» и «Обзор мер по интересам для правил ассоциации»у мер есть некоторые проблемы в некоторых случаях ... ни одна мера не идеальна.
Надеюсь, это поможет!