Извлечение данных тега Span с помощью Jsoup - PullRequest
5 голосов
/ 25 февраля 2012

Я пытаюсь извлечь конкретный контент в HTML с помощью Jsoup.Ниже приведен пример содержимого html.

<html xmlns="http://www.w3.org/1999/xhtml">
 <head> 
 </head>
 <body class="">
  <div class="shop-section line bmargin10 tmargin10">
   <div class="price-section fksk-price-section unit">
    <div class="price-table">
     <div class="line" itemprop="offers" itemscope="" itemtype="http://schema.org/Offer">
      <div class="price-save">
       <span class="label-td"><span class="label fksk-label">Price :</span></span>
      </div>
      <span class="price final-price our fksk-our" id="fk-mprod-our-id">Rs.<span class="small-font"> </span>11990</span>
     </div>
     <meta itemprop="price" content="Rs. 11990" />
     <meta itemprop="priceCurrency" content="INR" />
     <div class="our-price-desc fksk-our-price-desc">
      <small>(Prices are inclusive of all taxes)</small>
     </div>
    </div>
   </div>
  </div>
 </body>
</html>

Я получил требуемый вывод, используя следующую команду:

document.select(".price-table").select(".line").select("span").get(2).text()

Похоже, он длинный.Не могу ли я напрямую получить доступ к классу span («цена окончательная цена нашего fksk-our»)?

Любая помощь, касающаяся того же самого?

1 Ответ

5 голосов
/ 25 февраля 2012

Это у вас не работает?Не уверен, почему вы произвольно начинаете с price-table.

doc.select("span[class=price final-price our fksk-our]").text();

Если нет, это должно быть довольно близкоПосмотрите на синтаксис селектора JSoup ;это очень мощный.

...