Предполагая, что идентификатор данных находится в div
BeautifulSoup.find возвращает найденный HTML-элемент в виде словаря. Поэтому вы можете перемещаться по нему, используя стандартные средства, чтобы получить доступ к тексту (как вы сделали в своем вопросе), а также к HTML-тегам (как показано в коде ниже)
soup = BeautifulSoup('<div class="_article" data-id="qe67234">')
soup.find("div", {"class":"_article"})['data-id']
Обратите внимание, что часто для элементов видео требуется JS для воспроизведения, и вы не сможете найти необходимый элемент, если он был очищен с помощью не-JavaScript-клиента (т.е. python requests
).
Если это произойдет, вы должны использовать такие инструменты, как браузер phantomjs + selenium
, чтобы объединить веб-сайт с javascript для выполнения анализа.
EDIT
Если сам тег data-id
не является константой, вам следует обратиться к библиотеке lxml
для замены BeautifulSoup
и использовать значения xpath
, чтобы найти нужный вам элемент