Получение отрезков во вложенных элементах div с помощью XPath в HtmlUnit - PullRequest
0 голосов
/ 19 сентября 2018

Я новичок в XPath и у меня возникают проблемы с получением нужных значений с веб-сайта.Я использую это вместе с HtmlUnit.Это формат, с которым я сталкиваюсь:

<html>
  <head>
  <body>
    <div>
    <script>
    ..more scripts..
    <div>
       <header>
       <script>
       <script>
       <div>
         <div>
           <div>
           <div>
             <table>
               <thead>
               <tbody>
                 <tr>
                   <td>
                     <a>
                       <span>
                         <span> Random info to retrieve </span>
                   <td>
                     <a>
                       <span>
                         <span> Random info to retrieve </span>
                   <td>
                     <a>
                       <span>
                         <span> Random info to retrieve </span>
                 <tr>
                   <td>
                     <a>
                       <span>
                         <span> Random info to retrieve </span>
                   <td>
                     <a>
                       <span>
                         <span> Random info to retrieve </span>
                   <td>
                     <a>
                       <span>
                         <span> Random info to retrieve </span>
                   ..

Я хочу извлечь значения, но каждая попытка до сих пор не удалась.Я пытался найти диапазон только с помощью следующего xpath:

//span

, но затем я получаю только тот диапазон, который находится под заголовком, который меня не интересует. Я также пытался:

//body//div[2]//div[1]//div[1]//div[2]//table//tbody//tr//td//a//span

, который ничего не возвратил.Я также пробовал другие пути без успеха.Может кто-нибудь помочь мне с тем, каков будет правильный путь, чтобы получить все пролеты под столом?Заранее спасибо.

...