У меня есть список студентов. У меня есть их показатели посещаемости за прошлый год и их текущая посещаемость за этот год. Я пытаюсь определить вероятность того, что к концу года их станет меньше 90%. Ниже приведены мои данные:
Name %LastYear AttendedSoFarThisYear SessionsSoFarThisYear %SoFarThisYear SessionsNeeded SessionsLeft
Ethan 97% 218 232 94% 52 68
Molly 91% 202 232 87% 101 68
Henry 95% 226 232 97% 44 68
Итак, на данный момент я работаю над этим, выполняя SessionsNeeded, деленное на SessionsLeft, затем умножая на 100. Так что для Этана, который с вероятностью 76%, Молли с вероятностью 148% и Генри с вероятностью 65% опустится ниже 90%.
Однако я не думаю, что такой способ определения вероятности будет очень справедливым, потому что в начале года у каждого будет очень высокий процент вероятности, поскольку они не завершили ни одной сессии. Но на самом деле я хочу, чтобы он принял во внимание их посещаемость за предыдущий год, так что в начале года у Молли будет более высокая вероятность, чем у Итана.
Также необходимо учитывать их текущие показатели посещаемости, чтобы далеко. Поскольку Генри на самом деле посещает 97% времени, вполне вероятно, что он будет продолжать это делать. В то время как у Молли чуть меньше 87%, маловероятно, что она наверстает упущенное.
У кого-нибудь есть идеи, как я могу решить эту проблему, используя эти данные? Желательно в python или даже в excel?