Я практикую проблему со Spark, используя Scala, и у меня есть таблица футбольной лиги со столбцами (teamname, lastgame, nextgame, dateoflastgame, dateofnextgame
)
Я пытаюсь выполнить запрос данных, где я могу определить самый длинный пробегКоманда пойдет, не сыграв в одной команде дважды.IE Для команды (CHL, MNU, ARS, 01/01/2020,08/01/2020
)
В течение сезона есть несколько записей для КХЛ, имеющих все эти данные, я пытаюсь найти самый длинный пробег, который они имели бы, не наткнувшись на определенную команду, например, MCU.
Например, запуск будет выглядеть как в следующих играх, MCU-BHA-LIV-WHU-TOT-MCU
будет запускаться из 4 игр.
Я использовал spark sql и думаю, что буду пытаться играть в следующую игру where teamname='mnu'
, но яЯ совершенно озадачен тем, как бы я посчитал эти значения и вернул максимальный пробег игр, не играя в MCU.Кроме того, я хотел бы выполнить эту операцию против всех команд в лиге, чтобы получить список самых длинных заездов без игры в MCU.
Есть мысли, с чего я мог бы начать с этого?