Я пытался применить то, что другие предложили здесь:
Красивый суп: Доступ к элементам из
Но я не могу заставить его работать.Кажется, у человека из этого вопроса был «родительский» заголовок h2
, но тот, который я пытаюсь проанализировать, не имеет.
Вот веб-страница, которую я собираю:
https://nvd.nist.gov/
(я думаю) Я нашел элемент, которым нужно манипулировать, это <ul id="latestVulns">
и следующие его li
секции.
Я в основном хочу прочесть раздел, в котором написано «Последние 20 набранных идентификаторов уязвимостей и резюме», и, основываясь на данных об уязвимостях, отправить электронное письмо в соответствующий отдел моего рабочего места.
Вот мой код:
from bs4 import BeautifulSoup
import requests
source = requests.get('https://nvd.nist.gov/')
soup = BeautifulSoup(source.content, 'lxml')
section = soup.find('latestVulns')
print(section)
этот код возвращает None
Я в растерянности