Я новичок в python и хотел бы узнать разницу между двумя столбцами данных. Я хочу найти разницу между двумя столбцами и соответствующим третьим столбцом. Например, у меня есть датафрейм Soccer, который содержит список всей команды, играющей в футбол, с целями против и за свой клуб. Я хотел выяснить разницу между целями и названием команды. То есть (Goals Diff = goalFor-goalAgainst).
Pos Team Seasons Points GamesPlayed GamesWon GamesDrawn \
0 1 Real Madrid 86 5656 2600 1647 552
1 2 Barcelona 86 5435 2500 1581 573
2 3 Atletico Madrid 80 5111 2614 1241 598
GamesLost GoalsFor GoalsAgainst
0 563 5947 3140
1 608 5900 3114
2 775 4534 3309
Я попытался создать функцию, а затем выполнить итерацию по каждой строке кадра данных, как показано ниже:
for index, row in football.iterrows():
##pdb.set_trace()
goalsFor=row['GoalsFor']
goalsAgainst=row['GoalsAgainst']
teamName=row['Team']
if not total:
totals=np.array(Goal_diff_count_Formal(int(goalsFor), int(goalsAgainst), teamName))
else:
total= total.append(Goal_diff_count_Formal(int(goalsFor), int(goalsAgainst), teamName))
return total
def Goal_diff_count_Formal(gFor, gAgainst, team):
goalsDifference=gFor-gAgainst
return [team, goalsDifference]
Однако я хотел бы знать, есть ли самый быстрый способ получитьэто что-то вроде
dataframe['goalsFor'] - dataframe['goalsAgainst'] #along with the team name in the dataframe