Как скрести нетекст в html? - PullRequest
0 голосов
/ 04 января 2019

Я пытаюсь получить уникальную информацию из каждого контейнера в цикле. Я использую Python 3.7 и BeautifulSoup для очистки.

Я столкнулся с проблемой, когда пытаюсь получить уникальный идентификационный номер игрока.

Вот тег, в который вложено число:

<a cache="true" class="flexpop" content="tabs#ppc" fpopheight="357px" fpopwidth="490px" href="" instance="_ppc" leagueid="216415" playerid="14880" seasonid="2018" tab="null" teamid="-2147483648"> /a>

Я попытался a.split () превратить тег в список, где я мог бы просто указать нужные данные, но это не работает.

Я пытался использовать функцию выбора; a.select ("playerid"), но получить пустые скобки, как это [].

Любая помощь очень ценится! Благодарю.

Ответы [ 2 ]

0 голосов
/ 04 января 2019

Вы могли бы также использовать следующий синтаксис

from bs4 import BeautifulSoup as bs
h = '<a cache="true" class="flexpop" content="tabs#ppc" fpopheight="357px" fpopwidth="490px" href="" instance="_ppc" leagueid="216415" playerid="14880" seasonid="2018" tab="null" teamid="-2147483648"> /a>'
soup = bs(h,'lxml')
print(soup.select_one('a[playerid]')['playerid'])
0 голосов
/ 04 января 2019

Спасибо за User23332, за то, что указал мне направление, чтобы найти ответ.

Мне просто нужно было сделать:

a.attrs['playerid']
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...