Я все еще занимаюсь изучением веб-страниц, используя эту статью: https://www.pastemagazine.com/articles/2018/01/the-75-best-tv-shows-on-netflix-2018.html
Я хотел бы получить только номер ранга каждого шоу и найти то, что я считаю элементом HTML:
<div class="copy entry manual-ads"> <p> <b class="big"> "75." <i> <a href="https://www.netflix.com/search?q=chewing%20gum&jbv=80130911&jbp=0&jbr=0" class="ovr" target="_blank">Chewing Gum</a> </i> </b> </p> </div>
Я использую следующий код, чтобы получить только номер ранга (в данном случае «75.»):
doc.css("b.big").text
Однако, он возвращает номер ранга вместе споказать заголовок.Как я могу получить только номер ранга?
Используйте регулярное выражение:
doc.css("b.big").text[/\d+/]