Если вы загрузите html-страницу с помощью какого-либо загрузчика (wget
или curl
), вы увидите, что элементы вообще отсутствуют на странице. Элементы генерируются JavaScript.
Например (фрагмент из источника страницы):
<script type="text/javascript">document.write('<div class="b-post__body b-post__body_padtop_15 b-post__body_overflow_hidden b-layuot_width_full"> <div class="b-post__txt "> У нас есть для вас вакансия Full-stack PHP-разработчика на удаленную работу (полный рабочий день) или в офис (г. Москва). Работать нужно будет над нашими проектами, в том... </div> <div id="project-reason-3728923" style="display: none"> </div> </div>');</script>
У вас есть два варианта: выполнить javascript (с браузером и чем-то вроде selenium для его управления) или проанализировать его вручную, с помощью красивого супа, чтобы получить содержимое тега <script>
, затем извлечь текст внутри document.write()
и разбирая его с красивым супом.