Я пытаюсь отбросить некоторые значения столбцов таблицы, используя scrapy, и застрял в том, как получить значение столбца.Код сейчас
response.xpath('//table//tr//td[4]//text()').extract()
Он извлекает значения столбцов, но проблема в том, что некоторые столбцы имеют
<td> value 1 <sup> sup text </sup> </td>
, а возвращаемые значения value1 , sup text
, что не то, что яМне нужно только. Я попробовал код с td[4][not(sup)]
, но он полностью игнорирует столбцы с <sup>
.
Есть ли способ получить значения, исключая <sup>
.