Попытка соскрести данные с сайта Dividendinvestor.com - PullRequest
0 голосов
/ 21 июня 2020

Я пытаюсь импортировать некоторые данные об акциях, касающихся истории дивидендов, с помощью Google Таблиц.

Данные, которые я пытаюсь получить, взяты с этой страницы: https://www.dividendinvestor.com/dividend-quote/

(например, https://www.dividendinvestor.com/dividend-quote/ibm или https://www.dividendinvestor.com/dividend-quote/msft)

На других сайтах я мог использовать комбинацию ИНДЕКС и ИМПОРТ HTML для получения данных из таблицы. Например, если я хочу получить «Forward P/E» для IBM с сайта finviz.com, я делаю следующее:

=index(IMPORTHTML("http://finviz.com/quote.ashx?t=IBM","table", 11),11,10)

Это захватывает таблицу 11 и переходит на 11 строк и более 10 столбцов, чтобы получить фрагмент данных, который мне нужен.

Однако я не могу найти никаких таблиц для импорта через IMPORT HTML с сайта www.dividendinvestor.com/dividend-quote/ibm.

I ' m пытается импортировать значение справа от поля «Последовательное увеличение дивидендов».

В этом случае результат, которого я пытаюсь достичь, будет «19 лет».

I ' Я также пробовал IMPORT XML, но все, что я пробовал с XPATH (using this path: "/html/body/div[3]/div/div/div[2]/div/div/div[2]/div[2]/div[2]/span[20]" ), тоже терпит неудачу.

Есть какая-нибудь помощь? Желаемый конечный результат будет заключаться в том, что я динамически построю URL-адрес Dividendinvestor.com, добавив другой символ тикера, и получу результат того, сколько лет подряд увеличивается их выплата дивидендов.

Ответы [ 2 ]

1 голос
/ 21 июня 2020

Хорошее решение, предложенное @ player0. Если вы не хотите использовать INDEX, вы можете go с:

=IMPORTXML("https://www.dividendinvestor.com/dividend-quote/"&B3,"//a[.='Consecutive Dividend Increases']/following::span[1]")

Const

1 голос
/ 21 июня 2020
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...