Считайте, что тег
в моем html похож на это
<div class ="summary">
<p>Best <a class="abch" href="/canvas">canvas</a> abcdefgh <a class="zph" href="/canvas">canvas</a>, I cycle them to garden</p>
</div>
Когда я делаю
site.select('.//*[contains(@class, "summary")]/p/text()').extract()
, я получаю только текст p и гиперссылки теряются.Я хочу извлечь данные
, а также текстовые данные (например, холст выше).Внутри элемента
может быть любое количество тегов.они могут присутствовать или не присутствовать в теге
.
Любая идея, как извлечь все данные.