Как получить текст из Kick Starter с помощью XPath в Google Sheets - PullRequest
0 голосов
/ 30 апреля 2018

Я пытаюсь извлечь данные о местоположении из Kick Starter для добавления в мой существующий набор данных.

В настоящее время я использую Google Sheets вместе с XPath для захвата различных элементов, и у меня возникают проблемы только с текстовым элементом местоположения.

Это выглядит примерно так:

A1 = https://www.kickstarter.com/projects/1201626825/tori-scott-live-at-the-edinburgh-fringe-festival?ref=home_new_and_noteworthy
A2 = //a[@class="nowrap navy-700 flex items-center medium type-12"]/text()
IMPORTXML(A1, $A$2)

Как ни странно, независимо от того, вставляю я элемент text() или нет, я получаю сообщение Импортированный контент - пустая ошибка.

У меня также:

  • Схватил весь элемент списка (повышенный статус, категория, местоположение) с успехом
  • Попытка извлечения точного местоположения с ошибкой пустого содержимого

1 Ответ

0 голосов
/ 30 апреля 2018

Как насчет этого ответа? Я думаю, что есть несколько ответов для вашей ситуации. Поэтому, пожалуйста, подумайте об этом как об одном из них.

Часть 1:

=INDEX(IMPORTXML(A1, "//div[@class='block-lg hide']//div[@class='NS_projects__badges mb3']//div[@class='border-top border-bottom border-top-none-md border-none-lg nested-full-width-xs nested-full-width-sm nested-full-width-md mb4 mb5-sm mb0-md']//div[@class='grid-row']//div[@class='col-sm-22-24 col-offset-sm-1-24 col-offset-md-0-24']//div[@class='py2 py3-lg flex']//div[@class='flex items-center auto-scroll-x']"), 6)

или

=INDEX(IMPORTXML(A1, "//div[@class='block-lg hide']//div//div//div//div//div//div"), 6)

Часть 2:

=INDEX(IMPORTXML(A1, "//div[@class='col-full']//div[@class='NS_projects__badges mb3']//div[@class='border-top border-bottom border-top-none-md border-none-lg nested-full-width-xs nested-full-width-sm nested-full-width-md mb4 mb5-sm mb0-md']//div[@class='grid-row']//div[@class='col-sm-22-24 col-offset-sm-1-24 col-offset-md-0-24']//div[@class='py2 py3-lg flex']//div[@class='flex items-center auto-scroll-x']"), 6)

или

=INDEX(IMPORTXML(A1, "//div[@class='col-full']//div//div//div//div//div//div"), 6)

Результат:

Edinburgh, UK

Примечание:

Если я неправильно понимаю ваш вопрос, извините.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...