Python Beautiful Soup, как получить «data-id» - PullRequest
0 голосов
/ 06 февраля 2019

Я пытаюсь выяснить, как мне извлечь идентификатор данных из чего-то вроде

<div class="tweet-text" data-id="1091362563202396165">
 dir="ltr" href="h" rel="nofollow noopener" target="_blank" title=.html">cnbc.com/2019/02/01/non…</a>
</div> 

Я пробовал select('.data-id') также d.get_text('data-id'), d.match('data-id').Я пытаюсь извлечь фактическое значение в data-id, число .... Спасибо за вашу помощь.Тем временем я буду пытаться ...

1 Ответ

0 голосов
/ 06 февраля 2019

Вы можете использовать поисковый запрос attrs={"data-id": True}, чтобы найти элементы, которые имеют значение для data-id.

for item in soupdata.find_all(attrs={"data-id": True}):
    print (item['data-id'])
...