Набор данных супермаркета для алгоритма Apriori - PullRequest
5 голосов
/ 18 марта 2012

'Мне нужно разработать программное обеспечение, предназначенное для бизнес-аналитика супермаркета «Будущие магазины», оно выполняет анализ правил ассоциации на основе данных о переходных сделках по продаже супермаркетов и подготавливает политику дисконтирования путем подготовки Combo.Программное обеспечение использует алгоритмы интеллектуального анализа данных, а именно Apriori Algorithm.Правила ассоциации будут отображаться в удобной для пользователя форме для формирования политики дисконтирования на основе положительных правил ассоциации. '

Откуда я могу получить набор данных супермаркета для проверки алгоритма Apriori, который я кодировал?

Ответы [ 2 ]

7 голосов
/ 27 марта 2012

Чтобы получить набор рыночных данных, вы можете перейти по адресу: fimi.ua.ac.be/data/ и загрузить набор данных retail .

Это анонимные наборы данных транзакций избельгийский магазин.

Идеально подходит для тестирования Apriori или других алгоритмов интеллектуального анализа наборов часто встречающихся предметов.

0 голосов
/ 18 марта 2012

Вместо того, чтобы искать реальный набор данных, вы должны разработать небольшой специальный набор данных для каждого модульного теста.Набор данных должен обеспечивать минимально необходимые предварительные условия для проверки единой функции системы.Это облегчит обнаружение ошибок, поддержание тестов во времени и демонстрацию возможностей и моделей использования системы другим разработчикам.

Примером из другого домена могут быть тесты для пользовательской подсистемы, которая создает ипроверяет вход на сайт.

  • addsNewUser - пустой набор данных
  • throwsExceptionForDuplicateUsername - однопользовательский набор данных
  • correctPasswordPasses - тот же набор данных
  • throwsExceptionForIncorrectUsername - тот же набор данных
  • throwsExceptionForIncorrectPassword - тот же набор данных
  • throwsExceptionWhenNewUsernameExists - набор данных для двух пользователей

Обновление: Если вам нужен очень большой набор данных для выполнения интеграции или тестирования производительности, вам, вероятно, придется написать программу для генерации случайной коллекции покупок.Я сомневаюсь, что какие-либо существующие супермаркеты готовы (или способны) расстаться со своими реальными наборами данных.

При этом, работая много лет назад в качестве подрядчика для поставщика медицинского страхования (до HIPAA), мне далиобразец набора данных для работы.Он содержал реальную информацию о пациенте, включая номера SSN и конфиденциальную историю болезни.(

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...