Правила ассоциации в SQL / Снежинка - PullRequest
0 голосов
/ 17 апреля 2020

У меня есть большая (снежная) база данных транзакций, и я хочу изучить их с помощью изучения правил ассоциации.

Загрузка данных в память и использование, например, пакета R arules не подходит из-за требований к памяти.

Существует ли (R, python) пакет / sql код для вычисления правил ассоциации (с помощью алгоритма apriori или FP-роста) в самой базе данных?

Я знаю нечто подобное существует для SQL Сервер (https://www.sqlshack.com/the-association-rule-mining-in-sql-server/)

1 Ответ

0 голосов
/ 17 апреля 2020

В Snowflake нет ничего родного.

Вы можете попробовать адаптировать, например, эту парни sql Реализация: http://sqldatamine.blogspot.com/2014/02/associated-items-using-apriori-algorithm.html?_sm_au_=iVVR1RP6530TJ5SMqCc84K3L6t8Jp

Apriori - это "просто" алгоритм, так что это возможно, но я бы рекомендовал сначала взять случайную выборку из данных (например, 1M транзакций) и запустить apriori с вашим инструментом выбора (r, python, knime, ...). Если вы видите, что вы получаете интересные результаты, вы можете быть мотивированы, чтобы сделать это в полном объеме.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...