Я не был на 100% уверен, как правильно сформулировать название вопроса, так как это вполне конкретная вещь, которую я спрашиваю. Я упростил вопрос до основных соответствующих компонентов и составил несколько информационных фреймов, чтобы продемонстрировать, что мне нужно.
У меня есть данные вида:
Я пытаюсь запустить алгоритм прогнозирования для этих данных и хочу получить его в виде:
Где статистика player_id и game_id принимаются как комбинации предыдущих n (в данном примере n = 2) характеристик game_ids этого игрока.
Например, для player_id = 1 и game_id = 3 статистика устанавливается на сумму их соответствующие значения в game_id = 2 и game_id = 1. Я также хочу, чтобы игроки с отсутствующими показателями game_id обрабатывались как все stats = 0 для отсутствующего game_id (как в player_id = 2, game_id = 3 и 4).
Я думал о создании нового набора данных со строками для каждого player_id и каждой комбинации game_id в качестве индексов (начиная с game_id = n + 1, так как вам нужно как минимум n предыдущих игр с числом характеристик), а затем копируя значения fr о предыдущем наборе данных, использующем некоторую конкатенацию или объединение (взято из https://pandas.pydata.org/pandas-docs/stable/user_guide/merging.html), но я не уверен, что лучше всего сделать это с n строками, которые необходимо объединить на основе player_id и game_id.
Любая помощь или предложения приветствуются!