SCRAPY - XPATH выбирает объект внутри узла - PullRequest
0 голосов
/ 03 марта 2020

Мне нужно получить объект внутри переменной внутри узла, который является javascript узлом. (Использование scrapy 1.8.0 еще не обновилось, хе-хе)

Может быть, я не могу четко объяснить, но как только вы это увидите ... вы поймете.

  <head>
  <meta charset="UTF-8">
  <meta name="viewport" content="width=device-width, initial-scale=1.0">
  <title>Document</title>
  <script id='myscript'>
      oneVariable = {...}
      theVariable = {"Data": "blahblah", "More-Data": {...}}
  </script>
</head>
<body>

</body>
</html>

Хорошо Я получил весь узел с его информацией вручную, используя scrapy shell, а затем селектор

response.xpath('//*[@id="myscript"]').get()

Могу ли я получить "theVariable", который я хочу, только с помощью селекторов или функций XPATH (например, get (), getAll () et c)?

Заранее спасибо!

1 Ответ

0 голосов
/ 03 марта 2020

Попробуйте изменить выражение xpath на что-то вроде:

substring-after(//script[@id="myscript"],"theVariable = ")
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...