Основанный на SQL алгоритм роста FP - PullRequest
0 голосов
/ 02 октября 2019

, поэтому у меня есть пример набора элементов с именем tr_table , например, так:

+---------+-----------+
| tr_kode | item|
+---------+-----------+
| T1      |         1 |
| T1      |         2 |
| T1      |         2 |
| T1      |         5 |
| T2      |         1 |
| T2      |         3 |
| T2      |         4 |
| T2      |         5 |
| T2      |         6 |
| T3      |         1 |
| T3      |         2 |
| T4      |         4 |
| T4      |         2 |
| T4      |         6 |
| T5      |         6 |
| T5      |         5 |
| T5      |         4 |
| T6      |         3 |
| T6      |         6 |
| T6      |         2 |
| T7      |         2 |
| T7      |         1 |
| T7      |         7 |
+---------+-----------+

, затем я устанавливаю минимальную поддержку равной 20% и делаю частый просмотр элементов таблицыназывается freq_item . Это представление содержит выбранные частые элементы, которые были отсортированы.

+------+-----------+
| item | suppCount |
+------+-----------+
|    2 |         6 |
|    1 |         4 |
|    6 |         4 |
|    4 |         3 |
|    5 |         3 |
|    3 |         2 |
+------+-----------+

после этого я уже получаю таблицу транзакций, которая была выбрана и отсортирована, которая называется selected_tr

+------+------+
| tid  | item |
+------+------+
| T1   |    2 |
| T1   |    1 |
| T1   |    5 |
| T2   |    1 |
| T2   |    6 |
| T2   |    4 |
| T2   |    5 |
| T2   |    3 |
| T3   |    2 |
| T3   |    1 |
| T4   |    2 |
| T4   |    6 |
| T4   |    4 |
| T5   |    6 |
| T5   |    4 |
| T5   |    5 |
| T6   |    2 |
| T6   |    6 |
| T6   |    3 |
| T7   |    2 |
| T7   |    1 |
+------+------+

Я хочу спросить: как вы строите fp-дерево из selected_tr, а затем находите частый паттерн на основе алгоритма fp-growth. спасибо раньше.

...