Я пытаюсь очистить некоторые элементы, как показано ниже:
def parse(self, response):
item = GameItem()
item['game_commentary'] = response.css('tr td:nth-child(2)[style*=vertical-align]::text').extract()
item['game_movement'] = response.xpath("//tr/td[1][contains(@style,'vertical-align: top')]/text()").extract()
yield item
Моя проблема в том, что я не хочу yield
всех элементов, которые имеют селекторы response.xpath
или response.css
экстракты.
Есть ли способ, до назначения этих команд item['game_commentary']
и item['game_movement']
, применить regex
или что-то еще для фильтрации нежелательных значений, которые не должны быть получены?