Я использую Python 3 и Scrapy.
Это часть моего HTML:
<div class="class=a1">
<span class="a-small">TEXT <a class="a-nm" href="/a/b=data1?ie=UTF8&what-i-want=Nice+Home&the-data=correct&text=ABA+DNA&sort=yes">That's Correct
</span>
</div>
В href
есть этот текст: what-i-want
. Я хотел бы найти Nice+Home
, что-нибудь после what-i-want=
и до &
в href
.
Я пытался это сначала извлечь href
:
the_href = response.xpath('//a[contains(@href, "what-i-want")]/@href')
Я ожидал, что он вернется
/a/b=data?ie=UTF8&what-i-want=Nice+Home&the-data=correct&text=ABA+DNA&sort=yes
чтобы я мог извлечь из него Nice+Home
, но он не работает.
Как я могу это сделать?
обновление
это то, что я вижу на the_href
выходе:
[<Selector xpath='//a[contains(@href, "what-i-want")]/@href' data='/a/b=data1?ie=UTF8&t'>,
<Selector xpath='//a[contains(@href, "what-i-want")]/@href' data='/a/b=data2?ie=UTF8&t'>,
<Selector xpath='//a[contains(@href, "what-i-want")]/@href' data='/a/b=data3?ie=UTF8&t'>,
<Selector xpath='//a[contains(@href, "what-i-want")]/@href' data='/a/b=data4?ie=UTF8&t'>]