Доступ к имени класса во вложенных тегах с помощью scrapy - PullRequest
0 голосов
/ 30 августа 2018

У меня есть следующий документ

    <p class="contact-info " onclick="_ct('clntphn', 'lspg');">
    <i class="res_contactic resultimg"></i>
    <span>
        <a>
            <b>
                <span class="mobilesv icon-dc"></span>
                <span class="mobilesv icon-fe"></span>
                <span class="mobilesv icon-ji"></span>
                <span class="mobilesv icon-yz"></span>
                <span class="mobilesv icon-hg"></span>
                <span class="mobilesv icon-ba"></span>
                <span class="mobilesv icon-ji"></span>
                <span class="mobilesv icon-yz"></span>
                <span class="mobilesv icon-rq"></span>
                <span class="mobilesv icon-wx"></span>
                <span class="mobilesv icon-ts"></span>
                <span class="mobilesv icon-rq"></span>
                <span class="mobilesv icon-vu"></span>
                <span class="mobilesv icon-ji"></span>
                <span class="mobilesv icon-vu"></span>
                <span class="mobilesv icon-po"></span>
            </b>
        </a>
    </span>
</p>

У меня есть словарь Python, который отображает имена классов span на цифры. Например:

    [icon-dc:+,
     icon-fe:9
    ]
  1. Как получить доступ к именам классов в этих вложенных тегах с помощью scrapy и получить контактную информацию?

1 Ответ

0 голосов
/ 27 декабря 2018

попробуй: response.css(span span::attr(class)).extract() Это вернет список класса span как ['mobilesv icon-dc', 'mobilesv icon-fe', ...] Итерируйте по списку, разделите на space, получите второй атрибут и найдите содержание по вашему требованию.

Надеюсь, это то, что вы просите, иначе дайте мне знать.

Спасибо.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...