Всплеск Scrapy не вернет полный HTML - PullRequest
0 голосов
/ 01 апреля 2019

Я пытаюсь очистить эту ссылку https://www.myntra.com/women-kurtas-kurtis-suits.Но когда попробуйте сделать это через http API всплеск.Я получаю это ниже частично визуализированного результата enter image description here

Я что-то здесь упускаю?

Это фактическая страница.

enter image description here

1 Ответ

2 голосов
/ 01 апреля 2019

Если вы пытаетесь очистить продукты, почему бы вам не использовать HTML без рендеринга JS, возвращаемый по умолчанию?Внутри вы найдете JSON-объекты, содержащие информацию о товарах.Вот пример с веб-страницы, которую вы разместили:

    <script type="application/ld+json"> {"@context":"https://schema.org","@type":"Product","name":"AKS Women Blue & Grey Printed Kurta with Palazzos","image":"http://assets.myntassets.com/assets/images/8076903/2018/12/8/fb0cf882-a473-4aae-86c2-edf912b70b6e1544251004970-AKS-Women-Kurta-Sets-2261544251003921-1.jpg","description":"Women Printed Kurta with Palazzos","brand":{"@type":"Thing"},"offers":{"@type":"Offer","priceCurrency":"INR","price":989},"AggregateRating":{"@type":"AggregateRating","itemReviewed":"AKS Women Blue & Grey Printed Kurta with Palazzos","ratingCount":0,"reviewCount":""}}</script>

Используя библиотеку JSON Python, вы можете извлекать данные и использовать их по своему усмотрению.

...