Проблема в факторизации или категоризации данных в алгоритме априори - PullRequest
0 голосов
/ 28 августа 2018

Я пытаюсь найти правила ассоциации, используя алгоритм Apriori в R.

Когда я делаю следующее, выдается ошибка.

rules <- apriori(groceries, parameter = list(supp = 0.001, conf = 0.5))

Ошибка: столбцы 1, 2, 3, 4, 5 нелогичны или имеют значение. Использовать как .фактор или классифицировать первым.

На аналогичный вопрос ответили здесь .

Я понимаю, что значения столбцов должны быть категориальными, чтобы выполнить этот алгоритм для набора данных и ответа при условии, что все было в порядке.

Например, если у меня есть фрейм данных с именем groceries и столбцами "food", "medicine" и т. Д., Вызов is.factor(groceries$food) выдает следующую ошибку.

Оператор $ недействителен для атомных векторов

Мне интересно, позвонив is.factor (бакалейные товары $ food) должен вернуть ИСТИНА , поскольку мы преобразовали весь фрейм данных в факторы. Но если я сделаю,

groceries[] <- lapply(groceries, factor)

Мне удалось получить ИСТИНА для вызова is.factor () метода.

Что здесь произошло? В чем разница между двумя вышеуказанными методами. Оба работают нормально, но я сталкивался с этим вопросом. Любые объяснения этого высоко ценятся.

...