Выполнить самостоятельное объединение и агрегацию на фрейме данных Panda и Spark Scala, фрейме данных Python - PullRequest
2 голосов
/ 21 июня 2019

Соединение двух фреймов данных,

Команда, Капитан, Match_ID

A,      Jack,   13 
A,      Jack,   14
A,      Sam,    15 
B,      Nancy,  13
B,      Rob,    14
B,      Job,    15

Team_L, Team_R, Match_ID, Match_Date, команда-победитель

A           B       13      12011018    A
A           B       15      13011018    B

Выходной DataFrame должен иметь, Team_L, Team_R, Match_ID, Match_Date, команда-победитель,

и дополнительные поля 6 , WinRationOfTeam_L , WinRationOfTeam_R , WinRationOfTeam_L_VS_R , WinRationOfCaptain_L , WinRationOfCaptain_R , WinRatio_Captain_L_VS_R

Let Say,

  • WinRationOfTeam_L Команда L Сыграла 15 матчей и выиграла 10, затем команда A выиграла Рацион 10/15

    • WinRationOfCaptain_L Команда L с Джеком? Капитан сыграл 4 матча и выиграл 1, а команда А выиграл. Соотношение 1/4 = 0,25

    • WinRationOfTeam_L Команда L Сыграла 15 матчей с любой командой и выиграла 5, затем команда A выиграла. Соотношение 5/15 = 0,33

    • WinRationOfTeam_L_VS_R Команда A Сыграла 5 матчей с Командой R и выиграла 3, а затем победа команды A составляет 3/4 = 0,75

    • WinRatio_Captain_L_ON_R Команда A сыграла 3 с капитаном Джеком, сыграла с командой B с Робом в роли капитана и выиграла 2, затем WinRatio_Captain_L_ON_R = 2/3 = 0,66

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...