Я пишу простой веб-скребок для получения данных с веб-сайта Техасской комиссии по качеству окружающей среды (TCEQ). Информация, которая мне нужна, находится внутри тегов 'td'. Я очищаю соответствующий 'td', ссылаясь на предыдущий 'th', у которого у всех одинаковый текст, используемый для идентификации. Я использую find_next_sibling, чтобы очистить данные в переменную.
Вот мой код:
import requests
from bs4 import BeautifulSoup
URL = "https://www2.tceq.texas.gov/oce/eer/index.cfm?fuseaction=main.getDetails&target=323191"
r = requests.get(URL)
soup = BeautifulSoup(r.content, 'html.parser')
###This one works
report = soup.find("th", text="Incident Tracking Number:").find_next_sibling("td").text
###This one doesn't
owner = soup.find("th", text="Name of Owner or Operator:").find_next_sibling("td").text
Я получаю эту ошибку: AttributeError: У объекта 'NoneType' нет атрибута 'find_next_sibling'. Этот код имеет несколько строк, как две выше, и, подобно им, некоторые из них работают, а некоторые нет. Я посмотрел в HTML, чтобы увидеть, есть ли другой тег, но я не вижу его, если он есть. Пожалуйста и спасибо за любую помощь!