Работа с набором данных НФЛ с pandas, содержащим все характеристики атакующих игроков за первую неделю сезона 2019 года. В настоящее время у меня есть три DataFrames, один для передачи статистики, поспешной статистики и получения статистики. Я хочу объединить все три DataFrames в один окончательный DataFrame. Проблема в том, что некоторые игроки появляются в одном или нескольких кадрах данных. Например, QB может бегать и передавать мяч, поэтому некоторые QB появляются и в проходящем DF, и в бросающемся DF. «Player» - это общий индекс, с которым я хочу их объединить, но каждая дублированная строка также будет иметь общие значения «Pos» и «Tm». Поэтому я хочу объединить эти три DataFrames в столбцах «Player», «Tm» и «Pos».
В настоящее время каждый DataFrame сохраняется в переменной в списке с именем dfs.
Я пытался
df = dfs[0].join(dfs[1:])
, но в результате я получил DataFrame с одной строкой - Джулиан Эдельман - единственный игрок, который побежал, пропустил и поймал мяч в первую неделю 2019 года. время года. Достаточно сказать, что это не то, что я ищу.
Ниже скопированы первые пять строк каждого из фреймов данных.
Pos Tm PassingYds PassingTD Int PassingAtt Cmp
Player
Lamar Jackson QB BAL 324 5 0 20 17
Dak Prescott QB DAL 405 4 0 32 25
Robert Griffin QB BAL 55 1 0 6 6
Patrick Mahomes QB KAN 378 3 0 33 25
Kirk Cousins QB MIN 98 1 0 10 8
--------------------------------------------------------------------------
Pos Tm Rec Tgt ReceivingYds ReceivingTD
Player
Sammy Watkins WR KAN 9 11 198 3
Michael Gallup WR DAL 7 7 158 0
John Ross WR CIN 7 12 158 2
DeSean Jackson WR PHI 8 9 154 2
Marquise Brown WR BAL 4 5 147 2
---------------------------------------------------------------------------
Pos Tm RushingAtt RushingYds RushingTD
Player
Marlon Mack RB IND 25 174 1
Christian McCaffrey RB CAR 19 128 2
Saquon Barkley RB NYG 11 120 0
Dalvin Cook RB MIN 21 111 2
Mark Ingram RB BAL 14 107 2