Я пытаюсь выделить только текст, который не находится внутри элемента div. В этом случае я хочу исключить div с классом bbCodeBlock
. Как я могу это сделать? Идея состоит в том, чтобы исключить цитату.
демо
<li id="post-6062713">
<div class="uix_message ">
<div class="messageInfo">
<div class="messageContent">
<article>
<blockquote class="messageText SelectQuoteContainer">
<div class="bbCodeBlock bbCodeQuote">
<aside>
<div class="attribution type">user said:
<a href="#" class="AttributionLink">↑</a>
</div>
<blockquote class="quoteContainer">
<div class="quote">text to ignore</div>
</blockquote>
</aside>
</div>
text to change color
<br>
<br>
<br>
<br>
<div class="bbCodeBlock bbCodeQuote">
<aside>
<div class="attribution type">user said:
<a href="#" class="AttributionLink">↑</a>
</div>
<blockquote class="quoteContainer">
<div class="quote">text to ignore</div>
</blockquote>
</aside>
</div>
text to change color
<div class="messageTextEndMarker"> </div>
</blockquote>
</article>
</div>
</div>
</div>
</li>
Это базовая демонстрация, которую можно скопировать с помощью scrappy, потому что мне нужно исключить кавычки, поэтому я ищу однострочный селектор для применения к чему-то вроде
'text': quote.css('article blockquote').extract()