Давайте предположим, что я владелец магазина бургеров. Я регистрирую каждый раз, когда клиент покупает что-то в моем магазине, поэтому у меня есть реестры всех гамбургеров и молочных коктейлей, проданных за предыдущий месяц. Для меня проще и дешевле сделать 20 молочных коктейлей одновременно, чем сделать 1 за раз. Итак, вот моя цель:
- Я хочу знать, как часто клиент покупает молочный коктейль после покупки бургера, чтобы оценить, сколько молочных коктейлей я должен приготовить в течение следующего часа, основываясь на том, сколько бургеров я продал.
Что я планирую делать, так это переходить от ряда к ряду в моем наборе данных о гамбургерах и проверять, купил ли клиент, который купил этот гамбургер, молочный коктейль за 1 час или меньше. Но это будет O (M ^ B), потому что для каждого проданного бургера мне придется пройти весь ряд в моем наборе данных по молочному коктейлю. Что может быть более эффективным способом сделать это?
Это только первый подход, чтобы проверить, есть ли какая-либо корреляция между этими двумя продуктами. Более сложная модель будет следующим шагом.
(M - это число строк в моей таблице молочных коктейлей, а B - в таблице моего бургера)