Как получить значение href из атрибута javascript onclick в python, используя scrapy? - PullRequest
0 голосов
/ 15 мая 2018
<td class="headerStyle">
   <input type="image" 
       name="ctl00$ContentPlaceHolder1$gvfacletails$ctl19$lnkView" 
       id="lnkView" title="View" src="images/view.png" 
       onclick="javascript:WebForm_DoPostBackWithOptions(new WebForm_PostBackOptions("ctl00$ContentPlaceHolder1$gvfaculetails$ctl19$lnkView", "", false, "", "viewculty.aspx?FacultyID=Li9S-20151", false, false))">
</td>

Как извлечь этот href viewculty.aspx?FacultyID=Li9S-20151 сверху javascript onclick в python с помощью scrapy?

1 Ответ

0 голосов
/ 15 мая 2018
href = response.xpath('//input[@id="lnkView"]/@onclick').re_first( r'([^"]+\?[^"]+)' )

Выше я использую регулярное выражение и ищу ? и окружающие символы без кавычек

...