Поскольку вы не предоставили никакого кода для демонстрации того, как вы попали туда, где вы находитесь, я предполагаю, что вы знаете, как изолировать нужные теги "a".
Важно отметить, что в Пример «data-ldpemail» - это не тег, а атрибут тега для тега «a» (якоря). Предположим, у вас есть изолированный тег, который имеет этот атрибут для извлечения значения этого атрибута:
a_tag.attrs['data-ldpemail']
bs4.element.Tag.attrs
вернет словарь, содержащий все атрибуты тега в качестве ключей, со значением каждый тег в качестве значения словаря. Затем мы просто получаем доступ к этому ключу словаря атрибутов.
одна строка, чтобы получить все из некоторого супа:
email_list = [tag.attrs.get('data-ldpemail') for tag in soup.find_all('a') if tag.attrs.get('data-ldpemail') is not None]
То, что делает один вкладыш выше, - это найти все теги привязки в весь объект супа, проходит через этот набор, добавляя значение атрибута тега «data-ldpemail» в email_list
, если этот тег привязки имеет атрибут «data-ldpemail».