Как определить правильный xpath для IMPORT XML в Google Таблицах - ошибка н / д? - PullRequest
1 голос
/ 09 мая 2020

Я пытаюсь использовать функцию ИМПОРТ XML в Google Таблицах.

Например: =IMPORTXML("https://www.tiktok.com/@charlidamelio?lang=en", XMLPATH) должен вернуть «54,3M»

Я использовал Chrome инспектор чтобы скопировать xpath, который дает мне:

/html/body/div[1]/div/div[2]/div/div[1]/div/header/h2[1]/strong[2]

Когда я пробую это в Google Таблицах, он возвращает ошибку: # N / A (Импорт содержимого пуст).

PS Я открыт для других способов получить нужные мне данные в листе Google, для этого не обязательно использовать функцию IMPORT XML.

1 Ответ

0 голосов
/ 09 мая 2020

Как насчет этого ответа?

В этом ответе используются IMPORTXML и REGEXEXTRACT. Кроме того, предполагается, что URL-адрес https://www.tiktok.com/@charlidamelio?lang=en помещается в ячейку «A1».

Шаблон 1:

В этом шаблоне извлекается «followerCount».

Пример формулы:

=REGEXEXTRACT(IMPORTXML(A1,"//script[@id='__NEXT_DATA__']"),"followerCount"":(\d+)")
  • "FollowerCount" извлекается из скрипта.
  • В этом случае, когда используется =VALUE(REGEXEXTRACT(IMPORTXML(A1,"//script[@id='__NEXT_DATA__']"),"followerCount"":(\d+)")), полученное значение может использоваться как число.

Результат:

enter image description here

Шаблон 2:

В этом шаблоне "followerCount ".

Пример формулы:

=REGEXEXTRACT(IMPORTXML(A1,"//meta[@name='description']/@content")," ([\w\d.]+) Fans")
  • Значение" 54,4M Fans "извлекается из метаданных.

Результат:

enter image description here

Каталожные номера:

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...