подходящий алгоритм для поиска ассоциаций - PullRequest
0 голосов
/ 10 ноября 2011

У меня есть набор данных, подобный следующему

1=> aa,ser,sdf,gg,er,we <br/>
2=> gg,aa,uy,de,or,qq<br/>
3=> aa,er,we,uy<br/>
4=> oo,aa,gg,tr,dw<br/>
5=> iu,gg,re,de,ser<br/>

аналогичным образом происходит около 1000 транзакций.
я хочу оштрафовать, какие предметы встречаются чаще с

"аа", "аа" и "гг", "оо"

и т.д ...
всякий раз, когда я называю предмет, другие предметы, которые часто используются с ним, должны отображаться. Какой тип алгоритмов / алгоритмов подходит для использования в подобной ситуации?

Ответы [ 2 ]

0 голосов
/ 22 декабря 2016

Изучение правил ассоциации может быть простым и быстрым вариантом.

Есть много вариантов в зависимости от того, как вы хотите настроить решение. Проверьте это опрос по теме.

0 голосов
/ 10 ноября 2011

Разделите все это на одну большую таблицу из двух столбцов:

num,wrd
===,===
1,aa
1,er
1,gg
1,sdf
1,ser
1,we
2,aa
2,dd
...
5,re
5,ser

Оттуда проще запрашивать, что вы хотите. Например,

select wrd, count(*) from words group by wrd order by count(*) desc;
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...