Генерация счетчиков из закрытых частых наборов предметов - PullRequest
2 голосов
/ 25 мая 2011

Я читаю заметку, в которой, кажется, говорится: «Учитывая набор всех закрытых частых наборов элементов и их счетчиков поддержки, можно получить счетчик поддержки любого частого набора элементов».

Частый набор элементов называется закрытым, если его не содержит должным образом более крупный набор тот же подсчет поддержки.

Пытаюсь доказать это, но не могу разобраться.

Вот некоторые ссылки на определения майнинга правил ассоциации:

Майнинг правил ассоциации

Ответы [ 2 ]

1 голос
/ 28 марта 2012

Закрытый набор элементов X - это набор элементов, который не включен в другой набор элементов с такой же поддержкой.

Все наборы элементов Y1, Y2, Y3 .. YN, которые включены в X и имеют такую ​​же поддержку,говорят, что в том же классе эквивалентности.Они не являются закрытыми наборами элементов, потому что они включены в больший набор элементов с такой же поддержкой (X).

Теперь давайте скажем, что у вас есть набор всех частых закрытых наборов элементов C и вы хотите узнать о поддержкеиз набора предметов F.

То, что вам нужно сделать, очень просто.Вам нужно сравнить F со всеми частыми закрытыми наборами предметов.Вы должны найти наименьшие закрытые наборы элементов W, такие что F включен в W. Тогда поддержка F - это поддержка W.

Если вы хотите получить больше информации о закрытых наборах элементов, я предлагаю прочитать статью поPasquier:

http://citeseerx.ist.psu.edu/viewdoc/download;jsessionid=7956B5A50ED076203227367503FA7958?doi=10.1.1.37.1102&rep=rep1&type=pdf

Если вам нужен исходный код некоторых алгоритмов для майнинга закрытых наборов элементов, вы можете проверить мой Java-проект:

http://www.philippe -fournier-viger.com/spmf/

Предлагает AprioriClose и DCI_Closed.

0 голосов
/ 01 ноября 2013

Вы знаете, что ни один набор не может иметь более высокую поддержку, чем его подмножества ... поэтому поддержка любого данного набора элементов равна поддержке наиболее часто встречающегося надмножества: sup (x) = max {y.support | y является расширенным набором значений x, а y находится в частых закрытых наборах элементов}

Существует алгоритм для обеспечения поддержки всех наборов элементов, учитывая закрытые частые наборы элементов и их поддержку:

kmax = size of largest closed itemset
Fmax = closed frequent itemsets of size kmax
for k = kmax downto 1 do
    Fk = {f | f immediate subset of f' in Fk+1 or f is closed | |f|=k}
    for every f in Fk do
        if f is not closed
            f.support = max{f'.support | f' in Fk+1 , f' is a superset of f}
        endif
    endfor
endfor

Источник: http://www.cs.helsinki.fi/group/bioinfo/teaching/dami_s10/dami_lecture4.pdf

...