При создании веб-скребка я настроил таргетинг на контейнер, но не могу получить идентификатор твита - PullRequest
0 голосов
/ 02 мая 2019

Привет, я пытаюсь создать скребок для твиттера с bs4 в python.Это работает очень хорошо, но я только что обнаружил, что мне нужно также очистить идентификатор твитов, которые я очищаю

enter image description here

на картинкеиз предоставленного мною HTML я смог настроить таргетинг на контейнер "div" {"class": "tweet"} с этим кодом:

enter image description here

Кажется, я не могу получить код для извлечения "data-item-id".у кого нибудь есть совет как его получить?большое спасибо

1 Ответ

0 голосов
/ 02 мая 2019

Вы можете получить доступ к атрибутам как переменным после того, как выберете, используя soup.find.

soup.find ('div', {'class': 'tweet'}) ['data-tweet-id ']

Это выберет первый div с твитом класса и атрибутом data-tweet-id.

...