PowerBi: запрос HTML таблица - PullRequest
1 голос
/ 07 мая 2020

Что мне нужно

Мне нужно получить данные из этого источника . Предположим, я должен использовать для этого только PowerBi.

То, что я делал до сих пор

Если я использую опцию веб-источника basi c, тогда запрос будет просто в основном это htlm-анализ, с помощью которого я могу легко получить данные, найденные в области html страницы, например:

Источник:

enter image description here

Шаги, которые я выполняю с помощью параметра веб-источника:

enter image description here

enter image description here

Запрос:

enter image description here

(для упрощения примера предположим, что нам не нужны даты)

Вы можете скачать этот пример .pbix файл здесь .

Проблема

Проблема в том, что мне нужно больше данных, к которым нельзя получить доступ через html превью. Например, представим, что мне нужно получить данные с января 2010 года по апрель 2020 года. Эти запросы можно выполнить только с помощью этой кнопки, расположенной на веб-странице (которая экспортирует запрошенные данные в книгу Excel):

enter image description here

Идея состоит в том, чтобы автоматизировать этот процесс, поэтому постоянный переход к источнику и экспорт файла Excel не является вариантом.

Проверка элемент, который я понял, что он выполняет функцию javascript:

enter image description here

Вопрос

Как новичок в PowerBi / PowerQuery, мне интересно: есть ли способ получить эти данные напрямую с помощью PowerBi (возможно, как-то вызвать функцию js)? Если есть, то как?

Заранее спасибо.

1 Ответ

0 голосов
/ 07 мая 2020

Решение в моем случае заключалось в использовании параметров URL для извлечения данных без анализа таблицы html.

❌Оригинальный URL-адрес, который я использовал:

https://gee.bccr.fi.cr/indicadoreseconomicos/Cuadros/frmVerCatCuadro.aspx?idioma=1&CodCuadro=%20400

✔️ Новый URL-адрес для запроса с добавлением некоторых параметров:

https://gee.bccr.fi.cr/indicadoreseconomicos/Cuadros/frmVerCatCuadro.aspx?idioma=1&CodCuadro=%20400&Idioma=1&FecInicial=2010 / 01/01 & FecFinal = 2040/01/01 & Filtro = 0 & Exportar = True

Эта процедура работает только в этом случае, потому что, очевидно, параметры не будут такими же на других веб-сайтах pages.

Однако я публикую этот ответ, чтобы сохранить основную идею для тех, кто находится в аналогичной ситуации: сначала попробуйте с соответствующими параметрами URL-адреса, чтобы получить данные в другом формате. Конечно, сначала вы должны знать, какие параметры доступны, что является ограничением.

...