как найти внутренние элементы, когда все имя класса div и имя класса span совпадают, используя jsoup в java - PullRequest
0 голосов
/ 08 сентября 2018
<div class="xyOfqd">
   <div class="hAyfc">
     <div class="BgcNfc">Updated</div>
       <span class="htlgb">
          <div>
             <span class="htlgb">July 14, 2018</span>
          </div>
       </span>
     </div>
   <div class="hAyfc">
     <div class="BgcNfc">Size</div>
     <span class="htlgb">
        <div><span class="htlgb">3.9M</span></div>
     </span>
  </div>
</div>

Я хочу, чтобы весь текст выше html использовал jsoup в java.

Как и Обновлено Обновлено 14 июля 2018 г. Размер 3,9M

обновлен, размер неизменен, но дата и 3,9M - это динамические значения.

В основном я пытаюсь удалить значения из магазина Google Play.

1 Ответ

0 голосов
/ 08 сентября 2018

У вас есть две проблемы здесь:

  1. Поиск CSS-селектора элементов с одинаковыми именами. Это самая простая часть, потому что все они имеют разные селекторы. Если вы используете инструменты разработчика своего браузера, вы увидите, что селектор update равен div.hAyfc:nth-child(1) > div:nth-child(1), а селектор size равен div.hAyfc:nth-child(2) > div:nth-child(1).
  2. Получение динамических значений - ну, Jsoup не может получить динамические значения. Вы можете попытаться найти вызов ajax, который извлекает эти значения, и попытаться сделать то же самое с Jsoup, либо использовать какой-либо другой инструмент, например PhantomJS
...