Я пытаюсь получить список ингредиентов со следующей веб-страницы:
https://skinsalvationsf.com/2012/08/updated-comedogenic-ingredients-list/
Итак, первым ингредиентом, который я хочу вытащить, будет ацетилированный ланолин, а последним - октил пальмитат.
Глядя на источник страницы для этого URL, я узнаю, что шаблон для списка ингредиентов выглядит следующим образом:
<td valign="top" width="33%">Acetylated Lanolin <sup>5</sup></td>
Итак, я написал некоторый код для извлечения списка, и он дает мне нулевые результаты. Ниже приведен код.
import requests
r = requests.get('https://skinsalvationsf.com/2012/08/updated-comedogenic-ingredients-list/')
from bs4 import BeautifulSoup
soup = BeautifulSoup(r.text, 'html.parser')
results = soup.find_all('td', attrs={'valign':'top'})
Когда я пытаюсь len(results)
, это дает мне ноль.
Что я делаю не так? Почему я не могу вытащить список, как задумано? Я новичок в веб-скребках.