Что ж, наиболее широко используемые реализации исходного алгоритма правил ассоциации (первоначально разработанного в IBM Almaden Research Center) - это Apriori и Eclat, в частности реализации C на языке Кристиана Боргельта.
(Краткое резюме для тех, кто не знаком с Правилами ассоциации (также называемыми "Наборы часто встречающихся предметов" или "Анализ корзины товаров"). Прототип приложения для Правил ассоциации анализирует транзакции потребителей, например, данные супермаркетов: среди покупателей, покупающих польские товары колбаса, какой процент из тех, кто также покупает черный хлеб?)
Я бы порекомендовал статистическую платформу, R. Это бесплатный и открытый исходный код, а его репозиторий содержит (как минимум) четыре библиотеки, предназначенные исключительно для Правил ассоциации, все с отличной документацией - три из четыре пакета включают в себя руководство и отдельную виньетка (неофициальный прозаический документ с примерами кода). И руководства, и виньетки содержат множество примеров в коде R.
Я использовал три из четырех пакетов ниже и могу рекомендовать эти три. Среди них есть привязки для Eclat и Apriori. Эти библиотеки распространяются в виде пакетов R, которые доступны в CRAN , основном хранилище пакетов R. Базовая установка и настройка R тривиальна - есть бинарные файлы для Mac, Linux и Windows, доступные по ссылке выше. Аналогично, установка / интеграция пакетов так же проста, как и следовало ожидать от интегрированной платформы (хотя не у каждого из четырех перечисленных ниже пакетов есть бинарные файлы для каждой ОС).
Итак, на CRAN вы найдете эти Пакеты, ориентированные исключительно на Правила Ассоциации:
Этот набор из четырех пакетов R состоит из привязок R для четырех различных реализаций правил ассоциации, а также библиотеки визуализации.
Первый пакет, arules , включает в себя привязки R для Eclat и Apriori. Второй, arulesNBMiner , является привязкой для алгоритма правил ассоциации Майкла Хэслера NB-частые наборы элементов by. Третий, Последовательности arules , - это привязки для cSPADE .
Мохаммеда Заки *.
Последний из них особенно полезен, потому что это библиотека визуализации для вывода результатов любого из трех предыдущих пакетов. Я подозреваю, что для изучения вашей социальной сети вы найдете графическую визуализацию, т. Е. Явную визуализацию узлов (пользователей в наборе данных) и ребер (связей между ними).