Я пытаюсь найти шаблоны в игровом событии, которое происходит случайным образом с течением времени. Данные выглядят так:
ind start-time end-time starting-score closing-score
1 2020-01-02-13:00 2020-01-02-13:50 10 17
2 2020-01-04-07:00 2020-01-04-09:30 17 15
3 2020-01-07-23:00 2020-01-08-01:10 15 34
...
Как видите, событие (игра в игру) происходит случайным образом, его длительность случайна и приводит к изменению счета.
Сейчас ответы, которые я ищу, чтобы сделать мой анализ, включают:
- Какое лучшее время дня, чтобы играть в игру?
- Как долго вы должны играть, чтобы получить лучшие результаты?
- Есть ли закономерности? Например, если вы зарабатываете очки дважды подряд, можете ли вы потерять очки в следующем раунде?
- Лучше ли играть в игру каждый день? каково оптимальное время отдыха между сессиями и т. д. c.
Есть так много интересных вопросов, но я все еще не уверен, , как нацелиться на проблему.
Я подумал, что, возможно, анализ на основе признаков мог бы стать хорошим началом, т. Е. Разбить время начала / окончания на разные части дня (например, утром, вечером), тогда у меня будет категориальная особенность, то же самое можно сделать для длины игры (например, короткая, длинная). На первые 2 вопроса можно, вероятно, ответить, используя регрессионную (или логистическую c регрессионную) модель для результата points
, но я думаю, мне нужен какой-то анализ временных рядов, определяющий c, чтобы иметь возможность лучше понять и я не уверен, какие методы мне нужны.
Я ищу решение в Python
, и я видел пакеты типа traces
. Я предполагаю, что главная проблема, с которой я столкнулся, заключается в том, что большинство библиотек предназначены для регулярных временных рядов, а те, которые поддерживают нерегулярные, сосредоточены на том, как обращаться с отсутствующими данными, в то время как в этой проблеме ничего не пропущено, это просто природа данные, которые нерегулярны.