вероятность покупки предмета на основе прошлых покупок - PullRequest
0 голосов
/ 12 ноября 2018

У меня есть данные по отдельным покупкам.

В этих данных PANID - это человек, который купил товар на определенной неделе. В приведенном мной примере 6 уникальных PANID; итого 6 человек. Я пытаюсь рассчитать условную вероятность того, что PANID выкупит продукт во второй раз.

Например:

PANID 3104497 купил ITEM 7028 в WEEK 2010-01-11, а затем снова тот же PANID купил тот же ITEM в WEEK 2010-01-25. Я пытаюсь выяснить, как найти вероятность того, что они снова купят этот же предмет (в любой точке данных).

    PANID       WEEK ITEM
1 3104497 2010-01-11  526
2 3104497 2010-01-11  526
3 3104497 2010-01-11  526
4 3104497 2010-01-11  526
5 3104497 2010-01-11  526
6 3104497 2010-01-11 2890
...
705 3146217 2010-04-05   97
706 3146217 2010-04-05  132
707 3146217 2010-04-05  132
708 3146217 2010-04-05  132
709 3146217 2010-04-05  132
710 3146217 2010-04-05  132

Данные:

df <- structure(list(PANID = c(3104497L, 3104497L, 3104497L, 3104497L, 
3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 
3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 
3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 
3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 
3138990L, 3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 
3104497L, 3104497L, 3104497L, 3104497L, 3146217L, 3146217L, 3146217L, 
3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 
3138990L, 3138990L, 3138990L, 3138990L, 3104497L, 3104497L, 3104497L, 
3104497L, 3104497L, 3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 
3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 
3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 
3138990L, 3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 3138990L, 
3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 
3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 
3138990L, 3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 
3104497L, 3104497L, 3104497L, 3104497L, 3146217L, 3146217L, 3146217L, 
3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 
3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 
3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 
3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 3138990L, 
3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 
3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 
3138990L, 3322156L, 3322156L, 3322156L, 3322156L, 3322156L, 3322156L, 
3322156L, 3322156L, 3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 
3369710L, 3369710L, 3369710L, 3369710L, 3146217L, 3146217L, 3146217L, 
3146217L, 3146217L, 3322156L, 3322156L, 3322156L, 3322156L, 3138990L, 
3138990L, 3138990L, 3138990L, 3369710L, 3369710L, 3369710L, 3369710L, 
3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 
3146217L, 3146217L, 3146217L, 3138990L, 3138990L, 3138990L, 3138990L, 
3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 
3138990L, 3369710L, 3369710L, 3369710L, 3369710L, 3369710L, 3369710L, 
3369710L, 3369710L, 3322156L, 3322156L, 3322156L, 3322156L, 3146217L, 
3146217L, 3146217L, 3146217L, 3146217L, 3322156L, 3322156L, 3322156L, 
3322156L, 3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 3138990L, 
3138990L, 3138990L, 3138990L, 3104497L, 3104497L, 3104497L, 3104497L, 
3104497L, 3322156L, 3322156L, 3322156L, 3322156L, 3138990L, 3138990L, 
3138990L, 3138990L, 3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 
3322156L, 3322156L, 3322156L, 3322156L, 3369710L, 3369710L, 3369710L, 
3369710L, 3369710L, 3369710L, 3369710L, 3369710L, 3138990L, 3138990L, 
3138990L, 3138990L, 3369710L, 3369710L, 3369710L, 3369710L, 3104497L, 
3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 
3104497L, 3104497L, 3138990L, 3138990L, 3138990L, 3138990L, 3322156L, 
3322156L, 3322156L, 3322156L, 3322156L, 3322156L, 3322156L, 3322156L, 
3322156L, 3322156L, 3322156L, 3322156L, 3322156L, 3322156L, 3322156L, 
3322156L, 3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 
3104497L, 3104497L, 3104497L, 3104497L, 3146217L, 3146217L, 3146217L, 
3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 
3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 
3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 
3146217L, 3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 
3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 
3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 
3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 
3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 
3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 3138990L, 
3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 
3138990L, 3138990L, 3138990L, 3138990L, 3146217L, 3146217L, 3146217L, 
3146217L, 3146217L, 3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 
3138990L, 3138990L, 3138990L, 3369710L, 3369710L, 3369710L, 3369710L, 
3369710L, 3369710L, 3369710L, 3369710L, 3138990L, 3138990L, 3138990L, 
3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 
3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 
3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 
3138990L, 3138990L, 3138990L, 3138990L, 3104497L, 3104497L, 3104497L, 
3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 3104497L, 
3369710L, 3369710L, 3369710L, 3369710L, 3369710L, 3369710L, 3369710L, 
3369710L, 3138990L, 3138990L, 3138990L, 3138990L, 3104497L, 3104497L, 
3104497L, 3104497L, 3104497L, 3816413L, 3816413L, 3816413L, 3816413L, 
3816413L, 3816413L, 3816413L, 3816413L, 3816413L, 3816413L, 3816413L, 
3816413L, 3816413L, 3816413L, 3816413L, 3816413L, 3816413L, 3816413L, 
3816413L, 3816413L, 3816413L, 3816413L, 3816413L, 3816413L, 3816413L, 
3816413L, 3816413L, 3816413L, 3816413L, 3816413L, 3816413L, 3816413L, 
3816413L, 3816413L, 3816413L, 3322156L, 3322156L, 3322156L, 3322156L, 
3816413L, 3816413L, 3816413L, 3816413L, 3816413L, 3146217L, 3146217L, 
3146217L, 3146217L, 3146217L, 3322156L, 3322156L, 3322156L, 3322156L, 
3816413L, 3816413L, 3816413L, 3816413L, 3816413L, 3138990L, 3138990L, 
3138990L, 3138990L, 3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 
3322156L, 3322156L, 3322156L, 3322156L, 3146217L, 3146217L, 3146217L, 
3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 
3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 
3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 
3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 3138990L, 3322156L, 
3322156L, 3322156L, 3322156L, 3322156L, 3322156L, 3322156L, 3322156L, 
3322156L, 3322156L, 3322156L, 3322156L, 3104497L, 3104497L, 3104497L, 
3104497L, 3104497L, 3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 
3322156L, 3322156L, 3322156L, 3322156L, 3104497L, 3104497L, 3104497L, 
3104497L, 3104497L, 3816413L, 3816413L, 3816413L, 3816413L, 3816413L, 
3816413L, 3816413L, 3816413L, 3816413L, 3816413L, 3816413L, 3816413L, 
3816413L, 3816413L, 3816413L, 3146217L, 3146217L, 3146217L, 3146217L, 
3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 3322156L, 
3322156L, 3322156L, 3322156L, 3816413L, 3816413L, 3816413L, 3816413L, 
3816413L, 3322156L, 3322156L, 3322156L, 3322156L, 3816413L, 3816413L, 
3816413L, 3816413L, 3816413L, 3146217L, 3146217L, 3146217L, 3146217L, 
3146217L, 3322156L, 3322156L, 3322156L, 3322156L, 3146217L, 3146217L, 
3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 
3146217L, 3322156L, 3322156L, 3322156L, 3322156L, 3322156L, 3322156L, 
3322156L, 3322156L, 3322156L, 3322156L, 3322156L, 3322156L, 3322156L, 
3322156L, 3322156L, 3322156L, 3322156L, 3322156L, 3322156L, 3322156L, 
3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 
3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 
3146217L, 3146217L, 3146217L, 3146217L, 3146217L, 3146217L), 
    WEEK = structure(c(14620, 14620, 14620, 14620, 14620, 14620, 
    14620, 14620, 14620, 14620, 14620, 14620, 14620, 14620, 14620, 
    14620, 14620, 14620, 14620, 14620, 14620, 14620, 14620, 14620, 
    14620, 14620, 14620, 14620, 14620, 14620, 14620, 14620, 14620, 
    14620, 14620, 14620, 14620, 14620, 14620, 14620, 14620, 14620, 
    14620, 14620, 14620, 14620, 14620, 14620, 14620, 14620, 14620, 
    14620, 14620, 14620, 14620, 14620, 14620, 14620, 14620, 14620, 
    14620, 14620, 14620, 14620, 14620, 14620, 14620, 14620, 14620, 
    14620, 14620, 14620, 14620, 14620, 14620, 14620, 14620, 14620, 
    14620, 14620, 14620, 14620, 14620, 14620, 14620, 14620, 14620, 
    14620, 14620, 14620, 14620, 14620, 14620, 14620, 14620, 14620, 
    14620, 14620, 14620, 14620, 14620, 14620, 14620, 14620, 14620, 
    14620, 14620, 14620, 14620, 14620, 14620, 14620, 14620, 14620, 
    14620, 14620, 14620, 14620, 14620, 14620, 14620, 14620, 14620, 
    14620, 14620, 14620, 14620, 14620, 14620, 14620, 14620, 14620, 
    14620, 14627, 14627, 14627, 14627, 14627, 14627, 14627, 14627, 
    14627, 14627, 14627, 14627, 14627, 14627, 14627, 14627, 14627, 
    14627, 14627, 14627, 14627, 14627, 14627, 14627, 14627, 14627, 
    14627, 14627, 14627, 14627, 14627, 14627, 14627, 14627, 14627, 
    14627, 14627, 14627, 14627, 14627, 14627, 14627, 14627, 14627, 
    14627, 14627, 14627, 14627, 14627, 14627, 14627, 14627, 14627, 
    14627, 14627, 14627, 14627, 14627, 14627, 14627, 14627, 14627, 
    14627, 14627, 14627, 14627, 14627, 14627, 14627, 14627, 14627, 
    14627, 14627, 14627, 14627, 14627, 14627, 14627, 14627, 14627, 
    14627, 14627, 14627, 14627, 14627, 14627, 14627, 14627, 14627, 
    14627, 14627, 14627, 14627, 14627, 14627, 14627, 14627, 14627, 
    14627, 14627, 14627, 14627, 14627, 14634, 14634, 14634, 14634, 
    14634, 14634, 14634, 14634, 14634, 14634, 14634, 14634, 14634, 
    14634, 14634, 14634, 14634, 14634, 14634, 14634, 14634, 14634, 
    14634, 14634, 14634, 14634, 14634, 14634, 14634, 14634, 14634, 
    14634, 14634, 14634, 14634, 14634, 14634, 14634, 14634, 14634, 
    14634, 14634, 14634, 14634, 14634, 14634, 14634, 14634, 14634, 
    14634, 14634, 14634, 14634, 14634, 14634, 14634, 14634, 14634, 
    14634, 14634, 14634, 14634, 14634, 14634, 14634, 14634, 14634, 
    14634, 14634, 14634, 14634, 14634, 14634, 14634, 14634, 14634, 
    14634, 14634, 14634, 14634, 14634, 14634, 14634, 14634, 14634, 
    14634, 14634, 14634, 14634, 14634, 14634, 14634, 14634, 14634, 
    14634, 14634, 14634, 14634, 14634, 14634, 14634, 14634, 14634, 
    14634, 14634, 14634, 14634, 14634, 14634, 14634, 14634, 14634, 
    14641, 14641, 14641, 14641, 14641, 14641, 14641, 14641, 14641, 
    14641, 14641, 14641, 14641, 14641, 14641, 14641, 14641, 14641, 
    14641, 14641, 14641, 14641, 14641, 14641, 14641, 14641, 14641, 
    14641, 14641, 14641, 14641, 14641, 14641, 14641, 14641, 14641, 
    14641, 14641, 14641, 14641, 14648, 14648, 14648, 14648, 14648, 
    14648, 14648, 14648, 14648, 14648, 14648, 14648, 14648, 14648, 
    14648, 14648, 14648, 14648, 14648, 14648, 14648, 14648, 14648, 
    14648, 14648, 14648, 14648, 14648, 14648, 14648, 14648, 14648, 
    14648, 14648, 14648, 14648, 14648, 14669, 14669, 14669, 14669, 
    14669, 14669, 14669, 14669, 14669, 14669, 14669, 14669, 14669, 
    14669, 14669, 14669, 14669, 14669, 14669, 14669, 14669, 14669, 
    14669, 14669, 14669, 14669, 14669, 14669, 14669, 14669, 14669, 
    14669, 14669, 14669, 14669, 14669, 14669, 14669, 14669, 14669, 
    14669, 14669, 14669, 14669, 14669, 14669, 14669, 14669, 14669, 
    14669, 14669, 14676, 14676, 14676, 14676, 14676, 14676, 14676, 
    14676, 14676, 14676, 14676, 14676, 14676, 14676, 14676, 14676, 
    14676, 14676, 14676, 14676, 14676, 14676, 14676, 14676, 14676, 
    14676, 14676, 14676, 14676, 14676, 14676, 14676, 14676, 14676, 
    14676, 14676, 14676, 14676, 14676, 14676, 14676, 14676, 14676, 
    14676, 14676, 14676, 14676, 14676, 14676, 14676, 14676, 14676, 
    14676, 14676, 14676, 14676, 14676, 14676, 14676, 14676, 14676, 
    14676, 14676, 14676, 14676, 14676, 14676, 14683, 14683, 14683, 
    14683, 14683, 14683, 14683, 14683, 14683, 14683, 14683, 14683, 
    14683, 14683, 14683, 14683, 14683, 14683, 14683, 14683, 14683, 
    14683, 14683, 14683, 14683, 14683, 14683, 14683, 14683, 14683, 
    14683, 14683, 14683, 14683, 14690, 14690, 14690, 14690, 14690, 
    14690, 14690, 14690, 14690, 14690, 14690, 14690, 14690, 14690, 
    14690, 14690, 14690, 14690, 14690, 14690, 14690, 14690, 14690, 
    14690, 14690, 14690, 14690, 14690, 14690, 14690, 14690, 14697, 
    14697, 14697, 14697, 14697, 14697, 14697, 14697, 14697, 14697, 
    14697, 14697, 14697, 14697, 14697, 14697, 14697, 14697, 14697, 
    14697, 14697, 14697, 14697, 14697, 14697, 14697, 14697, 14697, 
    14697, 14697, 14697, 14697, 14697, 14697, 14697, 14697, 14697, 
    14697, 14697, 14697, 14697, 14697, 14697, 14704, 14704, 14704, 
    14704, 14704, 14704, 14704, 14704, 14704, 14704, 14704, 14704, 
    14704, 14704, 14704, 14704, 14704, 14704, 14704, 14704, 14704, 
    14704, 14704, 14704, 14704, 14704, 14704, 14704, 14704, 14704, 
    14704, 14704, 14704, 14704, 14704, 14704, 14704, 14704, 14704, 
    14704, 14704, 14704, 14704, 14704, 14704, 14704, 14704, 14704, 
    14704, 14704, 14704, 14704, 14704, 14704, 14704, 14704, 14704, 
    14704, 14704), class = "Date"), ITEM = c(526L, 526L, 526L, 
    526L, 526L, 2890L, 2890L, 2890L, 2890L, 2890L, 2933L, 2933L, 
    2933L, 2933L, 2933L, 548L, 548L, 548L, 548L, 548L, 106L, 
    106L, 106L, 106L, 106L, 6320L, 6320L, 6320L, 6320L, 6610L, 
    6610L, 6610L, 6610L, 7028L, 7028L, 7028L, 7028L, 7028L, 7414L, 
    7414L, 7414L, 7414L, 7414L, 1279L, 1279L, 1279L, 1279L, 1279L, 
    1425L, 1425L, 1425L, 1425L, 1425L, 6080L, 6080L, 6080L, 6080L, 
    1937L, 1937L, 1937L, 1937L, 1937L, 1L, 1L, 1L, 1L, 11321L, 
    11321L, 11321L, 11321L, 12064L, 12064L, 12064L, 12064L, 3L, 
    3L, 3L, 3L, 3448L, 3448L, 3448L, 3448L, 900L, 900L, 900L, 
    900L, 900L, 2202L, 2202L, 2202L, 2202L, 7363L, 7363L, 7363L, 
    7363L, 7362L, 7362L, 7362L, 7362L, 5995L, 5995L, 5995L, 5995L, 
    1251L, 1251L, 1251L, 1251L, 1251L, 76243L, 76243L, 76243L, 
    76243L, 76243L, 620L, 620L, 620L, 620L, 620L, 625L, 625L, 
    625L, 625L, 625L, 668L, 668L, 668L, 668L, 668L, 626L, 626L, 
    626L, 626L, 626L, 14772L, 14772L, 14772L, 14772L, 14772L, 
    27526L, 27526L, 27526L, 27526L, 27526L, 6320L, 6320L, 6320L, 
    6320L, 6500L, 6500L, 6500L, 6500L, 6560L, 6560L, 6560L, 6560L, 
    6610L, 6610L, 6610L, 6610L, 600L, 600L, 600L, 600L, 13902L, 
    13902L, 13902L, 13902L, 822L, 822L, 822L, 822L, 822L, 2178L, 
    2178L, 2178L, 2178L, 900L, 900L, 900L, 900L, 900L, 900L, 
    900L, 900L, 900L, 2202L, 2202L, 2202L, 2202L, 35202L, 35202L, 
    35202L, 35202L, 540L, 540L, 540L, 540L, 540L, 540L, 540L, 
    540L, 540L, 540L, 7363L, 7363L, 7363L, 7363L, 8312L, 8312L, 
    8312L, 8312L, 7362L, 7362L, 7362L, 7362L, 11L, 11L, 11L, 
    11L, 1251L, 1251L, 1251L, 1251L, 40268L, 40268L, 40268L, 
    40268L, 26037L, 26037L, 26037L, 26037L, 26037L, 26037L, 26037L, 
    26037L, 26037L, 4116L, 4116L, 4116L, 4116L, 4116L, 7789L, 
    7789L, 7789L, 7789L, 7028L, 7028L, 7028L, 7028L, 7028L, 1302L, 
    1302L, 1302L, 1302L, 13301L, 13301L, 13301L, 13301L, 240L, 
    240L, 240L, 240L, 240L, 24444L, 24444L, 24444L, 24444L, 900L, 
    900L, 900L, 900L, 960L, 960L, 960L, 960L, 2202L, 2202L, 2202L, 
    2202L, 38249L, 38249L, 38249L, 38249L, 28350L, 28350L, 28350L, 
    28350L, 28350L, 8358L, 8358L, 8358L, 8358L, 8358L, 5995L, 
    5995L, 5995L, 5995L, 40224L, 40224L, 40224L, 40224L, 40230L, 
    40230L, 40230L, 40230L, 40267L, 40267L, 40267L, 40267L, 40268L, 
    40268L, 40268L, 40268L, 42238L, 42238L, 42238L, 42238L, 42238L, 
    42274L, 42274L, 42274L, 42274L, 42274L, 42274L, 42274L, 42274L, 
    42274L, 42274L, 94L, 94L, 94L, 94L, 94L, 95L, 95L, 95L, 95L, 
    95L, 97L, 97L, 97L, 97L, 97L, 98L, 98L, 98L, 98L, 98L, 1278L, 
    1278L, 1278L, 1278L, 1278L, 1278L, 1278L, 1278L, 1278L, 1278L, 
    6346L, 6346L, 6346L, 6346L, 6346L, 6346L, 6346L, 6346L, 6346L, 
    6346L, 81014L, 81014L, 81014L, 81014L, 81014L, 15990L, 15990L, 
    15990L, 15990L, 15990L, 8321L, 8321L, 8321L, 8321L, 8321L, 
    8321L, 8321L, 8321L, 8321L, 8321L, 27509L, 27509L, 27509L, 
    27509L, 27512L, 27512L, 27512L, 27512L, 27551L, 27551L, 27551L, 
    27551L, 900L, 900L, 900L, 900L, 900L, 960L, 960L, 960L, 960L, 
    2202L, 2202L, 2202L, 2202L, 1111L, 1111L, 1111L, 1111L, 1081L, 
    1081L, 1081L, 1081L, 29422L, 29422L, 29422L, 29422L, 13830L, 
    13830L, 13830L, 13830L, 6080L, 6080L, 6080L, 6080L, 6L, 6L, 
    6L, 6L, 126L, 126L, 126L, 126L, 3637L, 3637L, 3637L, 3637L, 
    2202L, 2202L, 2202L, 2202L, 7357L, 7357L, 7357L, 7357L, 7357L, 
    7363L, 7363L, 7363L, 7363L, 7363L, 85121L, 85121L, 85121L, 
    85121L, 40268L, 40268L, 40268L, 40268L, 42238L, 42238L, 42238L, 
    42238L, 96166L, 96166L, 96166L, 96166L, 96166L, 80997L, 80997L, 
    80997L, 80997L, 80997L, 2891L, 2891L, 2891L, 2891L, 2891L, 
    5169L, 5169L, 5169L, 5169L, 5169L, 27536L, 27536L, 27536L, 
    27536L, 27536L, 6150L, 6150L, 6150L, 6150L, 6150L, 31846L, 
    31846L, 31846L, 31846L, 31846L, 42753L, 42753L, 42753L, 42753L, 
    42753L, 1302L, 1302L, 1302L, 1302L, 2663L, 2663L, 2663L, 
    2663L, 2663L, 900L, 900L, 900L, 900L, 900L, 900L, 900L, 900L, 
    900L, 2202L, 2202L, 2202L, 2202L, 2202L, 18285L, 18285L, 
    18285L, 18285L, 52531L, 52531L, 52531L, 52531L, 52531L, 7152L, 
    7152L, 7152L, 7152L, 1279L, 1279L, 1279L, 1279L, 1279L, 1425L, 
    1425L, 1425L, 1425L, 1425L, 13830L, 13830L, 13830L, 13830L, 
    6080L, 6080L, 6080L, 6080L, 3637L, 3637L, 3637L, 3637L, 2202L, 
    2202L, 2202L, 2202L, 26134L, 26134L, 26134L, 26134L, 600L, 
    600L, 600L, 600L, 1302L, 1302L, 1302L, 1302L, 1327L, 1327L, 
    1327L, 1327L, 900L, 900L, 900L, 900L, 900L, 900L, 900L, 900L, 
    900L, 900L, 900L, 900L, 900L, 900L, 96166L, 96166L, 96166L, 
    96166L, 96166L, 2395L, 2395L, 2395L, 2395L, 2395L, 2890L, 
    2890L, 2890L, 2890L, 2890L, 2891L, 2891L, 2891L, 2891L, 2891L, 
    75L, 75L, 75L, 75L, 75L, 5346L, 5346L, 5346L, 5346L, 5346L, 
    600L, 600L, 600L, 600L, 65020L, 65020L, 65020L, 65020L, 65020L, 
    1261L, 1261L, 1261L, 1261L, 668L, 668L, 668L, 668L, 668L, 
    1425L, 1425L, 1425L, 1425L, 1425L, 600L, 600L, 600L, 600L, 
    900L, 900L, 900L, 900L, 900L, 900L, 900L, 900L, 900L, 900L, 
    900L, 900L, 900L, 900L, 362L, 362L, 362L, 362L, 40258L, 40258L, 
    40258L, 40258L, 40268L, 40268L, 40268L, 40268L, 2549L, 2549L, 
    2549L, 2549L, 94L, 94L, 94L, 94L, 94L, 96L, 96L, 96L, 96L, 
    96L, 97L, 97L, 97L, 97L, 97L, 132L, 132L, 132L, 132L, 132L
    )), class = "data.frame", row.names = c(NA, -710L))

1 Ответ

0 голосов
/ 12 ноября 2018

В самом общем случае вы ожидаете, что что-то произойдет X раз за определенный период времени, если, конечно, это произошло X раз за сопоставимый период времени в прошлом.

output <- aggregate(df$PANID, by = list(df$ITEM, df$PANID), length)
colnames(output) <- c('ITEM', 'PANID', 'COUNT')
k <- as.integer(max(df$WEEK) - min(df$WEEK)) / 7 # number of weeks in the data
output$EXPECTATION <- output$COUNT / k
head(output)

#ITEM   PANID COUNT EXPECTATION
#1  106 3104497     5   0.4166667
#2  240 3104497     5   0.4166667
#3  526 3104497     5   0.4166667
#4  548 3104497     5   0.4166667
#5  900 3104497     5   0.4166667
#6 1251 3104497     5   0.4166667

Тем не менее, это очень сложный расчет. С большим количеством данных (например, с более длительными таймфреймами и большим временным разрешением) вы можете посмотреть на сезонность (не очень разумно ожидать, что продажи будут оставаться постоянными от месяца к месяцу, верно). Если бы у вас были реальные функции, описывающие PANID s и ITEM s, вы могли бы изучить возможные связи между этими функциями и количеством покупок. Действительно, вряд ли есть предел тому, насколько изощренным может быть такой анализ.

...