Допустим, у нас есть следующий ответ из браузера:
<div>
<tr id="1"></tr>
<tr id="2">
<!--
<div class="A">AAA</div>
<div class="C">BBB</div>
<div class="C">CCC</div>
-->
</tr>
</div>
Получение строки комментария с использованием xpath в scrapy должно выглядеть примерно так:
response.xpath(//tr[@id="2"]/comment())
Итак, мой вопрос - есть ли простой способ извлечь значения тегов <div class="C"
> внутри комментария? Один из способов - удалить теги комментариев в строке <!-- (...) -->
и использовать библиотеку lxml.html
, чтобы снова преобразовать результат в HTML и использовать в нем xpath, но я уверен, что это должен быть более простой способ. ..
Буду признателен за любую помощь. Ура!