Я использую BeautifulSoup, чтобы попытаться очистить данные со страниц игрового дня MLB.
Сейчас я просто пытаюсь извлечь идентификаторы игрового дня.
Вот пример страницы:
url = "http://gd2.mlb.com/components/game/mlb/year_2017/month_04/day_20/epg.xml"
soup = BeautifulSoup(urlopen(d_url), "lxml")
После этого я не уверен, как ориентироваться и находить идентификаторы.
Они хранятся в 2 разных местах для каждой игры:
game_data_directory="/components/game/mlb/year_2017/month_04/day_20/
gid_2017_04_20_bosmlb_tormlb_1"
gameday="2017_04_20_bosmlb_tormlb_1"
Какой лучший способ найти, а затем сохранить идентификаторы?
Спасибо.