Я пытаюсь очистить данные с помощью xpath:
<table class="ClassGrid" cellspacing="0" cellpadding="0" border="0" id="_ctl0_phMainContent_dgrdClasses" style="border-collapse:collapse;">
<tbody><tr>
<td class="ClassGridRow1" colspan="3"><hr></td>
</tr><tr>
<td class="ClassGridRow1"><div class="ClassGridBox1">Anaheim (OC)<br>1240 S. WALNUT ANAHEIM, CA 92802<br><br><a target="_blank" class="gridDirections" href="/Classes/Directions.aspx#104">Directions</a></div></td><td class="ClassGridRow2">
<div class="ClassGridBox2">Saturday, July 14</div>
</td><td class="ClassGridRow3">
<div class="ClassGridBox3"><a id="_ctl0_phMainContent_dgrdClasses__ctl3_hplAddToCart" class="whitelight" href="/validate.aspx?ClassID1=4233&ClassID2=0">Book Now</a></div>
</td>
</tr><tr>
<td class="ClassGridRow1">
<div class="ClassGridBox1"></div>
</td><td class="ClassGridRow2">
<div class="ClassGridBox2">Tuesday, July 31</div>
</td><td class="ClassGridRow3">
<div class="ClassGridBox3"><a id="_ctl0_phMainContent_dgrdClasses__ctl4_hplAddToCart" class="whitelight" href="/validate.aspx?ClassID1=4306&ClassID2=0">Book Now</a></div>
</td>
</tr><tr>
<td class="ClassGridRow1">
<div class="ClassGridBox1"></div>
</td><td class="ClassGridRow2">
<div class="ClassGridBox2">Saturday, August 4</div>
</td><td class="ClassGridRow3"><div class="ClassGridBoxNone">Class Full</div></td>
</tr><tr>
<td class="ClassGridRow1">
<div class="ClassGridBox1"></div>
</td><td class="ClassGridRow2">
<div class="ClassGridBox2">Saturday, August 18</div>
</td><td class="ClassGridRow3">
<div class="ClassGridBox3"><a id="_ctl0_phMainContent_dgrdClasses__ctl6_hplAddToCart" class="whitelight" href="/validate.aspx?ClassID1=4346&ClassID2=0">Book Now</a></div>
</td>
</tr><tr>
<td class="ClassGridRow1">
<div class="ClassGridBox1"></div>
</td><td class="ClassGridRow2">
<div class="ClassGridBox2">Thursday, August 30</div>
</td><td class="ClassGridRow3">
<div class="ClassGridBox3"><a id="_ctl0_phMainContent_dgrdClasses__ctl7_hplAddToCart" class="whitelight" href="/validate.aspx?ClassID1=4313&ClassID2=0">Book Now</a></div>
</td>
</tr><tr>
<td class="ClassGridRow1">
<div class="ClassGridBox1"></div>
</td><td class="ClassGridRow2">
<div class="ClassGridBox2">Saturday, September 8</div>
</td><td class="ClassGridRow3">
<div class="ClassGridBox3"><a id="_ctl0_phMainContent_dgrdClasses__ctl8_hplAddToCart" class="whitelight" href="/validate.aspx?ClassID1=4330&ClassID2=0">Book Now</a></div>
</td>
</tr><tr>
<td class="ClassGridRow1">
<div class="ClassGridBox1"></div>
</td><td class="ClassGridRow2">
<div class="ClassGridBox2">Tuesday, September 18</div>
</td><td class="ClassGridRow3">
<div class="ClassGridBox3"><a id="_ctl0_phMainContent_dgrdClasses__ctl9_hplAddToCart" class="whitelight" href="/validate.aspx?ClassID1=4331&ClassID2=0">Book Now</a></div>
</td>
</tr><tr>
<td class="ClassGridRow1" colspan="3"><hr></td>
</tr><tr>
<td class="ClassGridRow1"><div class="ClassGridBox1">Burbank (LA)<br>2100 Empire Ave. Burbank, CA 91504<br><a target="_blank" class="gridDirections" href="/Classes/Directions.aspx#190">Directions</a></div></td><td class="ClassGridRow2">
<div class="ClassGridBox2">Saturday, July 21</div>
</td><td class="ClassGridRow3">
<div class="ClassGridBox3"><a id="_ctl0_phMainContent_dgrdClasses__ctl11_hplAddToCart" class="whitelight" href="/validate.aspx?ClassID1=4242&ClassID2=0">Book Now</a></div>
</td>
</tr><tr>
<td class="ClassGridRow1">
<div class="ClassGridBox1"></div>
</td><td class="ClassGridRow2">
<div class="ClassGridBox2">Tuesday, August 28</div>
</td><td class="ClassGridRow3">
<div class="ClassGridBox3"><a id="_ctl0_phMainContent_dgrdClasses__ctl12_hplAddToCart" class="whitelight" href="/validate.aspx?ClassID1=4243&ClassID2=0">Book Now</a></div>
</td>
</tr><tr>
<td class="ClassGridRow1">
<div class="ClassGridBox1"></div>
</td><td class="ClassGridRow2">
<div class="ClassGridBox2">Tuesday, September 25</div>
</td></tr>
Это со страницы https://www.notaryclasses.com/Classes/ClassSchedule.aspx?ClassType=N, и структура таблицы не очень согласована. Кажется, что единственный способ, которым я могу даже приблизиться к извлечению контента между местоположениями, которые являются всеми тд, которые являются ClassGridBox1 элементами класса. Я пытаюсь отделить контент на основе каждого местоположения. Ранее здесь задавались похожие вопросы, но я не мог заставить их работать. Я просто пытаюсь выбрать все строки таблицы до тех пор, пока не появится тег hr . Пока что у меня есть: // td / node () [предыдущая :: tr [содержит (/., "Анахайм")] и следующая :: td [содержит (., "Бербанк")]] .
Это работает нормально только для первой локации. Если я попытаюсь сделать то же самое и попытаться остановиться на следующей горизонтальной линии, мне не повезет. Спасибо за вашу помощь.