Импорт данных XML в Google Sheets из веб-источника - PullRequest
0 голосов
/ 04 декабря 2018

Я пытаюсь создать лист Google, который извлекает информацию из репозитория IRS Form 990, размещенного на AWS S3.

Вот XML-файл: Пример 990 Форма в XML

Запрос, который я выполняю, предназначен для извлечения названий компаний в разделе «Расписание I» из XMLисточник.Название компании заключено в теги BusinessNameLine1Txt.

Используя встроенную функцию IMPORTXML из Google Sheet, я построил следующее:

=IMPORTXML("https://s3.amazonaws.com/irs-form-990/201702299349300445_public.xml", "//Return/ReturnData/IRS990ScheduleI/RecipientTable/RecipientBusinessName/BusinessNameLine1Txt")

Когда я выполняю функцию с параметрами, указанными выше, я получаю сообщение об ошибке, сообщающее, чтоимпортированный контент пуст.Мой XPATH-запрос неверен или это связано с какой-то причудой в данных?

1 Ответ

0 голосов
/ 05 декабря 2018

Как насчет этой модификации?

=IMPORTXML(A1, "//*[local-name()='BusinessNameLine1Txt']")

Результат:

enter image description here

Ссылка:

Если я неправильно понимаю вашу проблему, пожалуйста, сообщите мне,Я хотел бы изменить его.

Редактировать:

=IMPORTXML(A1, "//*[local-name()='IRS990ScheduleI']//*[local-name()='BusinessNameLine1Txt']")

Результат:

enter image description here

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...