Я пытаюсь извлечь текст из тега страницы <dd></dd>
с помощью этой команды в оболочке srapy:
[w.strip() for w in response.xpath('//ul[@class="attribute-list"]/li/dl/dd/text()').extract()]
Тег dd выглядит следующим образом:
<dd> Edelstahl <br>gebürstet (silberfarben) </dd>
scrapy возвращает:
'Edelstahl', 'gebürstet (silberfarben)', more dd elements...
Теперь важно, чтобы я получил либо только первый элемент "Edelstahl", либо оба скомпонованных "Edelstahl gebürstet (silberfarben)", но в любом случае не два элемента из одного тега dd.Как этого достичь?