Как использовать алгоритм Apriori для сопоставления правил ассоциации на фрейме данных, где имена элементов представлены в виде атрибутов - PullRequest
0 голосов
/ 04 мая 2020

Я работаю над Гостиничным набором данных и хочу знать Правила, по которым люди отменяют бронирование.

У меня есть 2 фрейма данных, один со списком людей, которые этого не делали отменить бронирование и тот, кто отменил бронирование.

Предположим, у нас есть датафрейм всех эпоплей, которые отменили заказы со столбцом isCancelled, удаленным как:

df.head(3)
>>
id    hotelName    Year    Month    paymentMethod    daysStayed
0     Paradise     2017    Jan      Online           NaN
1     Diamond      2019    Jan      Cash             NaN
2     Paradise     2019    March    Cash             0
3     Taj          2016    Dec      Online           0

Как я могу использовать алгоритм Apriori для этого формата данных ?

Все примеры, доступные в Интернете, предназначены для анализа корзины рынка и имеют вид

id    items
1     [a,c,s,d,f]
2     [s,f,e,]

. Пожалуйста, предложите метод использования данных для этого типа данных, метод и какую библиотеку. на python.

...