Набор данных для алгоритма Apriori - PullRequest
4 голосов
/ 01 сентября 2011

Я собираюсь разработать приложение для анализа Market Basket (с использованием алгоритма apriori), и я нашел набор данных, который содержит более 90 000 записей транзакций.

проблема в том, что в этом наборе данных нет названий элементов, а содержится только штрих-код элементов.

Я только начинаю проект и занимаюсь исследованием алгоритма apriori. Может ли кто-нибудь помочь мне с этим делом, как наилучшим образом реализовать этот алгоритм с использованием следующего набора данных?

Ответы [ 3 ]

1 голос
/ 13 октября 2011

эти типы наборов данных считаются критически важной информацией, и цепные хранилища не будут предоставлять вам эту информацию, но вы можете самостоятельно создать некоторый примерный набор данных с помощью SQL Server.

1 голос
/ 28 марта 2012

Алгоритм не требует названия элементов.

1 голос
/ 13 сентября 2011

Алгоритм определяется независимо от идентификаторов, используемых для объекта. Кроме того, вы не опубликовали «следующий набор данных»: P Если ваша проблема в том, что алгоритм ожидает, что ваши элементы будут пронумерованы 0,1,2, ... тогда просто отсканируйте ваш набор данных и сопоставьте каждый отдельный штрих-код с номер.

Если вам интересно, было несколько статей о том, как очень эффективно представлять наборы часто встречающихся предметов: http://www.google.de/url?sa=t&source=web&cd=1&ved=0CB8QFjAA&url=http%3A%2F%2Fciteseerx.ist.psu.edu%2Fviewdoc%2Fdownload%3Fdoi%3D10.1.1.163.4827%26rep%3Drep1%26type%3Dpdf&ei=QdVuTsn7Cc6WmQWD7sWVCg&usg=AFQjCNGDG8etNN2B4GQ52pSNIfQaTH7ajQ&sig2=7r3buh8AcfJmn2CwjjobAg

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...