Я работаю над Гостиничным набором данных и хочу знать Правила, по которым люди отменяют бронирование.
У меня есть 2 фрейма данных, один со списком людей, которые этого не делали отменить бронирование и тот, кто отменил бронирование.
Предположим, у нас есть датафрейм всех эпоплей, которые отменили заказы со столбцом isCancelled
, удаленным как:
df.head(3)
>>
id hotelName Year Month paymentMethod daysStayed
0 Paradise 2017 Jan Online NaN
1 Diamond 2019 Jan Cash NaN
2 Paradise 2019 March Cash 0
3 Taj 2016 Dec Online 0
Как я могу использовать алгоритм Apriori для этого формата данных ?
Все примеры, доступные в Интернете, предназначены для анализа корзины рынка и имеют вид
id items
1 [a,c,s,d,f]
2 [s,f,e,]
. Пожалуйста, предложите метод использования данных для этого типа данных, метод и какую библиотеку. на python.