Я собрал набор транзакций в файл CSV в формате:
{Pierre, lait, oeuf, beurre, pain}
{Paul, mange du pain,jambon, lait}
{Jacques, oeuf, va chez la crémière, pain, voiture}
Я планирую провести простой анализ правил ассоциации, но сначала я хочу исключить элементы из каждой транзакции, которые непринадлежат ReferenceSet = {lait, oeuf, beurre, pain}
.
Таким образом, мой результирующий набор данных будет, в моем примере:
{Pierre, lait, oeuf, beurre, pain}
{Paul,lait}
{Jacques, oeuf, pain,}
Я уверен, что это довольно просто, но я хотел бы прочитать предложения / ответы напомогите мне немного.