, поэтому у меня есть пример набора элементов с именем tr_table , например, так:
+---------+-----------+
| tr_kode | item|
+---------+-----------+
| T1 | 1 |
| T1 | 2 |
| T1 | 2 |
| T1 | 5 |
| T2 | 1 |
| T2 | 3 |
| T2 | 4 |
| T2 | 5 |
| T2 | 6 |
| T3 | 1 |
| T3 | 2 |
| T4 | 4 |
| T4 | 2 |
| T4 | 6 |
| T5 | 6 |
| T5 | 5 |
| T5 | 4 |
| T6 | 3 |
| T6 | 6 |
| T6 | 2 |
| T7 | 2 |
| T7 | 1 |
| T7 | 7 |
+---------+-----------+
, затем я устанавливаю минимальную поддержку равной 20% и делаю частый просмотр элементов таблицыназывается freq_item . Это представление содержит выбранные частые элементы, которые были отсортированы.
+------+-----------+
| item | suppCount |
+------+-----------+
| 2 | 6 |
| 1 | 4 |
| 6 | 4 |
| 4 | 3 |
| 5 | 3 |
| 3 | 2 |
+------+-----------+
после этого я уже получаю таблицу транзакций, которая была выбрана и отсортирована, которая называется selected_tr
+------+------+
| tid | item |
+------+------+
| T1 | 2 |
| T1 | 1 |
| T1 | 5 |
| T2 | 1 |
| T2 | 6 |
| T2 | 4 |
| T2 | 5 |
| T2 | 3 |
| T3 | 2 |
| T3 | 1 |
| T4 | 2 |
| T4 | 6 |
| T4 | 4 |
| T5 | 6 |
| T5 | 4 |
| T5 | 5 |
| T6 | 2 |
| T6 | 6 |
| T6 | 3 |
| T7 | 2 |
| T7 | 1 |
+------+------+
Я хочу спросить: как вы строите fp-дерево из selected_tr, а затем находите частый паттерн на основе алгоритма fp-growth. спасибо раньше.