Как извлечь данные Breadcrumb на странице полетов Expedia с помощью Excel / VBA - PullRequest
0 голосов
/ 06 сентября 2018

Я провел свое исследование, но, поскольку у меня нет большого опыта в программировании, мне все еще трудно понять, как это сделать!

По сути, у меня есть список URL-адресов, которые я хотел бы очистить с помощью данных Breadcrumb на странице. С помощью этой информации я могу быстро выяснить, о каком городе, странах находятся эти страницы.

пример панировочных сухарей на странице

Эта страница: https://www.expedia.co.uk/Cheap-Flights-To-Las-Vegas.d178276.Travel-Guide-Flights например, я вижу HTML-код для хлебных крошек, как показано ниже. Как я могу извлечь эту информацию с помощью Excel?

Спасибо за вашу помощь! высоко ценится!

<div class="container  ">
                    <div class="site-content-wrap grid-container cf">
<div class="uitk-col uitk-layout all-col-1-1 desktop-col-1-1 tablet-col-1-1 smalltablet-col-1-1 mobile-col-1-1" data-fm="968204">
    <hr class="separator simple"  id="separator-1" />
<div class="flex-module breadcrumbs default-view" id="breadcrumbs-1" data-fm="968206" data-fm-title-id="">
    <nav class="bread-crumb cf" itemscope itemtype="http://schema.org/WebPage">
        <ol aria-label="breadcrumb" itemprop="breadcrumb" itemscope itemtype="http://schema.org/BreadcrumbList">
                    <li itemprop="itemListElement" itemscope itemtype="http://schema.org/ListItem">
                        <a href="/" itemprop="item" data-flex-analytics="flight.TRAVEL_GUIDE_FLIGHTS.Breadcrumbs" data-flex-events="event151"><span itemprop="name">Expedia.co.uk</span></a><span aria-hidden="true" class="separator">&nbsp;&bull;&nbsp;</span>
                        <meta itemprop="url" content="/" />
                        <meta itemprop="position" content="1" />
                    </li>
                    <li itemprop="itemListElement" itemscope itemtype="http://schema.org/ListItem">
                        <a href="/Flights" itemprop="item" data-flex-analytics="flight.TRAVEL_GUIDE_FLIGHTS.Breadcrumbs" data-flex-events="event151"><span itemprop="name">Flights</span></a><span aria-hidden="true" class="separator">&nbsp;&bull;&nbsp;</span>
                        <meta itemprop="url" content="/Flights" />
                        <meta itemprop="position" content="2" />
                    </li>
                    <li itemprop="itemListElement" itemscope itemtype="http://schema.org/ListItem">
                        <a href="/Destinations-In-United-States-Of-America.d201.Flight-Destinations" itemprop="item" data-flex-analytics="flight.TRAVEL_GUIDE_FLIGHTS.Breadcrumbs" data-flex-events="event151"><span itemprop="name">United States of America</span></a><span aria-hidden="true" class="separator">&nbsp;&bull;&nbsp;</span>
                        <meta itemprop="url" content="/Destinations-In-United-States-Of-America.d201.Flight-Destinations" />
                        <meta itemprop="position" content="3" />
                    </li>
                    <li itemprop="itemListElement" itemscope itemtype="http://schema.org/ListItem">
                        <a href="/Destinations-In-Nevada.d230.Flight-Destinations" itemprop="item" data-flex-analytics="flight.TRAVEL_GUIDE_FLIGHTS.Breadcrumbs" data-flex-events="event151"><span itemprop="name">Nevada</span></a><span aria-hidden="true" class="separator">&nbsp;&bull;&nbsp;</span>
                        <meta itemprop="url" content="/Destinations-In-Nevada.d230.Flight-Destinations" />
                        <meta itemprop="position" content="4" />
                    </li>
                            <li itemprop="itemListElement" itemscope itemtype="http://schema.org/ListItem">
                                <strong aria-hidden="true" itemprop="name">Flights to Las Vegas</strong>
                                <strong class="visuallyhidden">
                                    Flights to Las Vegas, current page
                                </strong>
                                <meta itemprop="url" content="http://www.expedia.co.uk/Cheap-Flights-To-Las-Vegas.d178276.Travel-Guide-Flights" />
                            </li>
    </ol>
    </nav>
</div>
...