Я новичок в Pandas и Python, и я просто не могу понять, как сделать то, что очень легко сделать в Excel. Я надеялся получить небольшую помощь от сообщества.
Предположим, у меня есть следующая информация о фэнтези-футболе с тремя столбцами - «Имя», «Год» и «FantasyPts». . Код ниже.
import pandas as pd
df = pd.DataFrame({'Name': ['Tom Brady', 'Tom Brady', 'Tom Brady', 'Patrick Mahomes', 'Patrick Mahomes', 'Patrick Mahomes'],
'Year': [2019, 2018, 2017, 2019, 2018, 2017],
'FantasyPts': [300, 350, 400, 500, 400, 50],
})
Я хочу добавить в таблицу еще один столбец под названием «FantasyPtsPreviousYear», но мне очень сложно понять, как это сделать в Pandas / Python.
Я хочу сделать следующее:
- Для каждой строки таблицы python / pandas проверьте имя и год в этой строке df.
- Найдите количество очков фэнтези, набранных тем же игроком в предыдущем году (например, Год - 1)
- Заполните это число в новой строке df под названием 'FantasyPtsPreviousYear' или, если нет данных для предыдущего года для этого игрока введите 0.
В Excel я бы просто создал новые столбцы и использовал бы эти столбцы с ВПР. Самая близкая вещь, которую мне удалось найти для VLOOKUP в Pandas, - это слияние, но это, похоже, здесь не работает (или, по крайней мере, я не могу понять, как заставить его работать с этим конкретным приложением c). После попытки найти ответ, я думаю, что это может иметь какое-то отношение к функции lo c () и For l oop, но я не могу заставить его работать.
Спасибо за любая помощь, которую вы можете предоставить! Я очень ценю это и считаю, что это сообщество великолепно за всю ту помощь, которую оно предоставляет!