Извлечь данные из таблицы, где сайт постоянно вводит новые данные в таблицу - PullRequest
0 голосов
/ 07 октября 2019

Я пытаюсь получить данные таблицы в Google Sheets. В таблице на сайте постоянно добавляются новые данные. (Последние данные о торговле). Я действительно плохо знаком с веб-очисткой и HTML-кодом. Я даже не уверен, смотрю ли я на правильный элемент HTML или мне нужно смотреть на XPATH для ImportXML.

URL-адрес: https://www.deribit.com/main#/options?tab=all

XPATH: //*[@id="tradesScrollC"]

Element: <div id="tradesScrollC" class="table-scrollable-deribit" style="max-height: 200px;overflow-y: auto" onscroll="BTCOptions.scrollTradesC(event);">
                            <table class="table table-hover table-condensed table-nopadding" float-thead="floatTheadOptions">
                                <thead>
                                <tr>
                                    <th ng-i18next="app.assets">Assets</th>
                                    <th ng-i18next="app.price">Price</th>
                                    <th ng-i18next="app.imp_v">IV</th>
                                    <th ng-i18next="app.Qty">Qty</th>
                                    <th ng-i18next="app.time">Date Time</th>
                                </tr>
                                </thead>
                                <tbody id="last_trades_call"></tbody>
                            </table>
                        </div>

Я пробовал и importXML, и importHTML, однако я не уверен, что представляет собой каждый тег, и использую ли я егоправильно.

=IMPORTXML("https://www.deribit.com/main#/options?tab=all", "//div[@id='tradesScrollC']/table")

Я хотел бы распечатать все данные о сделках по мере их обновления на веб-сайте, а также печатать на моем листе Google. С заголовками столбцов точно так же, как на сайте (Активы Цена IV Кол-во Даты Время)

1 Ответ

0 голосов
/ 07 октября 2019

речь идет не о формуле, а о сайте. вам нужно будет найти другой, потому что Google Sheets не может очистить содержимое JavaScript. Вы можете проверить это, просто отключив JS для данного сайта, и вы увидите пустую страницу вроде:

e


это все, что вы можетеполучить:

=ARRAY_CONSTRAIN(IMPORTXML("https://www.deribit.com/main#/options?tab=all", "//*"), 1000, 10)

0


=ARRAY_CONSTRAIN(IMPORTDATA("https://www.deribit.com/main#/options?tab=all"), 1000, 10)

0

...