Как очистить данные от элемента <script>с помощью Scrapy - PullRequest
0 голосов
/ 29 сентября 2019

Я пытаюсь очистить URL-адреса изображений с сайта magento run.URL-адреса фотографий продуктов указаны в

<script type="text/x-magento-init">
    {
        "[data-gallery-role=gallery-placeholder]": {
            "mage/gallery/gallery": {
                "mixins":["magnifier/magnify"],
                "magnifierOpts": {"fullscreenzoom":"20","top":"","left":"","width":"","height":"","eventType":"hover","enabled":false},
                "data": [{"thumb":"https:\/\/example.com.com\/media\/catalog\/product\/cache\/7298259c5e8adb86380aac\/m\/a\/product-image-1.jpg",
                "img":"https:\/\/example.com.com\/media\/catalog\/product\/cache\/d86efc38c3706eb137091cd\/m\/a\/product-image-2.jpg",
                "full":"https:\/\/example.com.com\/media\/catalog\/product\/cache\/9222bce87e716be292\/m\/a\/product-image-3.jpg",
                "caption":"Product Title","position":"1","isMain":true,"type":"image","videoUrl":null},
                {"thumb":"https:\/\/example.com.com\/media\/catalog\/product\/cache\/7298259c41aa66380aac\/m\/a\/product-image-1.jpg",
                "img":"https:\/\/example.com.com\/media\/catalog\/product\/cache\/d86efc38c3706eb13bb117091cd\/m\/a\/product-image-2.jpg","full":"https:\/\/example.com.com\/media\/catalog\/product\/cache\/9222bce87e78616be292\/m\/a\/product-image-3.jpg",
                "caption":"Product 2 Title","position":"2","isMain":false,"type":"image","videoUrl":null},
...

. Что мне нужно, так это значения full.Я не гуру Python, но мне удалось получить внутреннюю часть элемента script в объекте dict.Не уверен, что это правильный шаг или нет, и как оттуда идти.

Есть какие-нибудь советы?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...