Некоторые веб-страницы заполняют данные с использованием Javascript, и то, что кажется содержимым страницы, на самом деле отсутствует в HTML, который обрабатывает Beautiful Soup.Это одна из тех страниц.
Это сбивает с толку, потому что если вы просматриваете отображаемую страницу с помощью инструментов веб-разработчика в (скажем) Safari или Chrome, вы найдете HTML-код, отображаемый в DOM.Однако, если вы посмотрите на источник страницы, вы его вообще не найдете.
Так что для этой страницы вы не можете разобрать данные с Beautiful Soup.Одним из вариантов может быть сайт, который предоставит вам данные более прямым способом.Другой может быть попытаться использовать библиотеку requests-html
, которая может запускать Javascript, а затем вы можете очистить данные от визуализированного HTML.(Примечание: я никогда не пробовал requests-html
сам, и нужно соблюдать осторожность при запуске Javascript таким образом, но это приемлемый способ сделать это.) Есть также проекты, где люди использовали Selenium или что-то подобное в качестве способаполучить HTML для очистки.Но requests-html
выглядит самой простой вещью, которую можно попробовать.