Script Extract Script Value - PullRequest
       2

Script Extract Script Value

1 голос
/ 05 марта 2019

Используя оболочку scrapy по определенному URL, я пытаюсь определить, как я могу извлечь значение автора или значение соавтора из этого сценария в исходном коде страницы? Я пытался

response.xpath('//script').re(r'author":"([0-9.]+)"') 

это скрипт в исходном коде сайта

<script charSet="UTF-8">...
"author":"3810161","contributor":{"id":"3810161"}},
</script>

1 Ответ

0 голосов
/ 06 марта 2019

Вы пытались распечатать все содержимое <script> с самого Scrapy?Я предполагаю, что вы не увидите тот же контент, который вы видите в вашем навигаторе, так как узлы этих тезисов представляются как Javascript, а Scrapy не обрабатывает Javascript.

Если вы просто хотите извлечь некоторый контент из результатов поиска в этих тезисах, вы могли бы просто использовать api (тот же параметр поиска, который вы опубликовали, но дать вам ответ JSON, действительно легче анализировать ...)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...