Зачистка ранга с использованием Nokogiri в Ruby - PullRequest
0 голосов
/ 09 октября 2018

Я все еще занимаюсь изучением веб-страниц, используя эту статью: https://www.pastemagazine.com/articles/2018/01/the-75-best-tv-shows-on-netflix-2018.html

Я хотел бы получить только номер ранга каждого шоу и найти то, что я считаю элементом HTML:

<div class="copy entry manual-ads">
  <p>
    <b class="big">
      "75."
      <i> 
        <a href="https://www.netflix.com/search?q=chewing%20gum&jbv=80130911&jbp=0&jbr=0" class="ovr" target="_blank">Chewing Gum</a>
      </i>
    </b>
  </p>
</div>

Я использую следующий код, чтобы получить только номер ранга (в данном случае «75.»):

doc.css("b.big").text

Однако, он возвращает номер ранга вместе споказать заголовок.Как я могу получить только номер ранга?

1 Ответ

0 голосов
/ 10 октября 2018

Используйте регулярное выражение:

doc.css("b.big").text[/\d+/]
...