Ошибка RapidMiner: обычные атрибуты должны иметь тип binomial. Анализ Корзины Рынка - PullRequest
1 голос
/ 07 марта 2012

Я пытаюсь научиться пользоваться RapidMiner, и мой начальник хочет, чтобы я провел анализ корзины рынка для набора данных. Но когда я использую данный шаблон, я получаю следующую ошибку:

Обычные атрибуты должны иметь тип binomial.
Это дается с помощью оператора FP-Growth.

У меня есть столбец customerID (только цифры), productName (буквы) и количество продуктов (цифры).

Поскольку я новичок в RM, я понятия не имею, что не так.

Любая информация будет принята с благодарностью.
Заранее спасибо.

Ответы [ 2 ]

2 голосов
/ 09 мая 2012

FP-Growth нуждается в ExampleSet в качестве входных данных, где все обычные атрибуты являются биноминальными, что в данном случае означает логическое значение.Иногда биноминальный атрибут имеет предопределенное положительное / истинное и отрицательное / ложное значение, в противном случае положительное значение можно указать в качестве параметра в операторе FP-Growth.Более того, каждый пример представляет транзакции (или корзину вашего покупателя) и каждый атрибут предмета в вашей полной линейке продуктов, посредством чего значение этого атрибута определяет, находится товар в корзине или нет.

Чтобы найти правила ассоциации, сначала нужно найти часто встречающиеся наборы предметов.Это работа оператора FP-Growth.Ваша задача - преобразовать ExampleSet в «базу данных транзакций», то есть все атрибуты являются биноминальными.

К сожалению, шаблон в RapidMiner немного глючит.Чтобы исправить процесс, вы должны добавить два оператора перед оператором FP-Growth.Прежде всего необходимо заменить все пропущенные значения значением 0 (оператор «Заменить пропущенные значения» и параметр «по умолчанию» на ноль).После замены вам понадобится оператор «Числовой в биноминальный».Значения параметров по умолчанию достаточны для преобразования всех атрибутов в биноминальные.Процесс должен запуститься сейчас!Обратите внимание, что вам нужна небольшая минимальная поддержка, чтобы найти частые наборы предметов.

0 голосов
/ 07 марта 2012

Скорее всего, вам потребуется преобразовать (сложить) ваши данные в формат с одной строкой на клиента (транзакции, на самом деле) и одним столбцом количества (двоичный файл) для каждого продукта. Используйте разреженные векторы, чтобы сохранить и сохранить все 0 s.

...