Спасибо всем за вклад!Я все еще не смог вытащить aria-label
и читал на некоторых других форумах, что это проблема BS4 при разборе HTML.
Однако я смог решить эту проблему довольно легко, используя решение @SmashGuy, ивытягивая альтернативное текстовое описание против aria-label
.
img_data = []
for img_tag in soup.find_all('img'):
data_dict = dict()
data_dict['image_name'] = img_tag['alt']
data_dict['image_url'] = img_tag['src']
img_data.append(data_dict)
И писать в CSV ...
with open('BCDS1.csv', 'w', newline='') as birddata:
fieldnames = ['image_name', 'image_url']
writer = csv.DictWriter(birddata, fieldnames=fieldnames)
writer.writeheader()
for data in img_data:
writer.writerow(data)
Еще раз спасибо за помощь всем!Ура!