Использование скрапа для сбора данных с веб-страницы кинотеатра.
Работа с селекторами xpath, если я использую селекторы с методом extract (), например:
def parse_with_extract(self, response):
div = response.xpath("//div[@class='col-sm-7 col-md-9']/p[@class='movie__option']")
data = i.xpath("text()").extract()
return data
Возвращает:
![Result of extract() on selectors](https://i.stack.imgur.com/H3MRj.png)
Если я использую селектор с методом extract_first () как таковой:
def parse_with_extract_first(self, response):
div = response.xpath("//div[@class='col-sm-7 col-md-9']/p[@class='movie__option']")
storage = []
for i in div:
data = i.xpath("text()").extract_first()
storage.append(data)
return storage
Возвращает:
![Result of extract_first() on selectors](https://i.stack.imgur.com/h8frf.png)
Почему метод extract () возвращает все символы, включая "\ xa0" и метод extract_first (), возвращая вместо этого пустую строку ????