Вот мой код:
import bs4 as bs
from urllib.request import urlopen
page = urlopen("https://www.netimoveis.com/locacao/minas-gerais/belo-horizonte/bairros/santo-antonio/apartamento/#1/").read()
soup = bs.BeautifulSoup(page, "lxml")
div_lista_locacao = soup.select("div#lista-locacao")[0]
ul_tags = list(div_lista_locacao.children)
print("ul_tags = ",ul_tags)
(Вы видите, что я напечатал список, содержащий дочерние элементы div_lista_locacao).
Вывод:
ul_tags = ['\n']
(И он показывает только разрыв строки, хотя есть фактические дочерние элементы, как вы можете видеть ниже).
Это HTML-код моего источника:
<!DOCTYPE html>
<html xmlns="http://www.w3.org/1999/xhtml" style="" class=" js flexbox flexboxlegacy canvas canvastext webgl no-touch geolocation postmessage no-websqldatabase indexeddb hashchange history draganddrop websockets rgba hsla multiplebgs backgroundsize borderimage borderradius boxshadow textshadow opacity cssanimations csscolumns cssgradients no-cssreflections csstransforms csstransforms3d csstransitions fontface generatedcontent video audio localstorage sessionstorage webworkers applicationcache svg inlinesvg smil svgclippaths"
lang="pt">
<head></head>
<body id="topo_geral" itemscope="" itemtype="http://schema.org
/WebPage">
<div id="container-hero" class="container-fluid"></div>
<div id="resultado" class="container-fluid page-container">
<!-- DESKTOP -->
<div id="banner-resultado" class="col col-xs-12 col-sm-12 col-
md-12col-lg-12 text-center hide"></div>
<div class="row hidden-xs hidden-sm">
<div class="col col-xs-12 col-sm-12 col-md-3 col-lg-3 filtro-
resultado"></div>
<div class="col col-xs-12 col-sm-12 col-md-9 col-lg-9 box-
resultado-hidden-xs hidden-sm"></div>
<button id="btn-ordenacao-por-valor" data-ordenar="asc" class="btnbtn-valor btn-branco"></button>
<ul class="nav nav-tabs" role="tablist" id="myTab"></ul>
<div class="tab-content">
<div role="tabpanel" class="tab-pane active" id="locacao">
#Currently manipulating this tag beneath. This is the "div_lista_locacao" variable.
<div id="lista-locacao" class="col col-xs-12 col-sm-12 col-
md-12 col-lg-12 nopadmar">
##Need to iterate between these 'ul' tags beneath and parse the text internally.
## But they won't show up in the .children list.
<ul class="ul-resultado paginacao paginacao_numero_1" style="display: block;"></ul>
<ul class="ul-resultado paginacao paginacao_numero_2" style="display: block;"></ul>
<ul class="ul-resultado paginacao paginacao_numero_3" style="display: none;"></ul>
</div>
</div>
</div>
</div>
</div>
</body>
</html>
##I can reply with the contents inside the 'ul' tags if requested.
##But I just thought it wouldn't be necessary for this particular question.
Я использую "lxml" для его анализа, но я уже пытался изменить его на "html.parser" , "html5lib" и "xml" .Все дают схожие результаты.
Итак, это парсер?Это библиотека, которую я использовал для загрузки веб-страницы?Разве это не скачать этот раздел?Или, может быть, ошибка BS?ИДК.