Scrap селектор вне тега HTML - PullRequest
0 голосов
/ 17 ноября 2018

У меня есть особый случай, когда тег сценария находится вне тега html:

<html>
....
</html>

<script>data</script>

Селекторы css и xpath не находят этот тег сценария, единственный способ, который я нашел, - это использовать response.text, но он отвечает гигантской строкой, и я не могу выполнять операции регулярного выражения с ним с помощью селектора re ().

Есть ли способ использовать теги CSS или Xpath вне тега html?

Я пытался с

response.css('script') 

Но учитывайте только теги сценария внутри тега html

Спасибо

1 Ответ

0 голосов
/ 17 ноября 2018

Исправление:

Селектор CSS не считает теги вне HTML, xpath делает.

Я использовал некоторые условия для фильтрации тега:

response.xpath('//script[contains(., "function SelectItem()")]')
...