Несколько вкладок таблицы с постоянным URL - PullRequest
0 голосов
/ 14 января 2020

Я пытаюсь получить информацию из таблицы предприятий - названия компаний, адреса, номера телефонов - которые отформатированы аналогично. Я могу получить эту информацию через IMPORT HTML (и IMPORT XML) для первой страницы результатов при загрузке URL. Однако есть несколько вкладок таблицы под одним и тем же URL-адресом.

Как мне написать формулу ИМПОРТА HTML, чтобы она извлекала соответствующую информацию из других вкладок таблицы?

URL (в А2 Google Sheets): https://www.tcia.org/TCIA/Directories/FindQualifiedTreeCare.aspx?State=MD

Формула:

=IMPORTHTML(A2,"table",3)

Ответы [ 2 ]

0 голосов
/ 15 января 2020

Как упомянуто @ player0, это невозможно, потому что URL одинаков для всех Page.

Посмотрите на функцию javascript для каждой ссылки

Для страницы 1 :

__doPostBack(
  'ctl01$TemplateBody$WebPartManager1$gwpste_container_MemberResults$ciMemberResults$gvSearchResults',
  'Page$1')

Для страницы 2:

__doPostBack(
  'ctl01$TemplateBody$WebPartManager1$gwpste_container_MemberResults$ciMemberResults$gvSearchResults',
  'Page$2')

Для страницы 3:

__doPostBack(
  'ctl01$TemplateBody$WebPartManager1$gwpste_container_MemberResults$ciMemberResults$gvSearchResults',
  'Page$3')

Поэтому, когда вы включаете эту функцию в консоль браузера, вы будет перенаправлен на соответствующую страницу.

Можно ли добавить эту функцию в адресную строку, чтобы мы могли получить прямой URL?

Это невозможно по соображениям безопасности браузеры блокируют эту практику в целом.

Любые способы обойти это?

Вот шаги, которые я бы сделал:

  1. Вы можете использовать python драйвер браузера для имитации поведения пользователя в браузере
  2. Веб-утилита данных на локальный компьютер
  3. Загрузка данных с помощью Google Sheets API
  4. Разобрать его как угодно с помощью Apps Script

Надеюсь, это поможет

0 голосов
/ 14 января 2020

к сожалению, это невозможно в Google Sheets, поскольку URL одинаков для всех просмотров страниц

enter image description here

0

...