Соскрести Instagram Web Hashtag Посты - PullRequest
1 голос
/ 23 сентября 2019

Я пытаюсь собрать количество постов в данный хэштег (#castles) и заполнить ячейку Google Sheet с помощью ImportXML.

Я попытался скопировать Xpath из Chrome и вставить его в параметр ImportXMLв такой ячейке:

=ImportXML("https://www.instagram.com/explore/tags/castels/", "//*[@id="react-root"]/section/main/header/div[2]/div/div[2]/span/span")

Я обнаружил, что есть проблема с кавычками, поэтому я также попытался:

=ImportXML("https://www.instagram.com/explore/tags/castels/", "//*[@id='react-root']/section/main/header/div[2]/div/div[2]/span/span")

Тем не менее, оба возвращают ошибку.

Что я делаю не так?

PS Мне известен Xpath к описанию мета-тега "//meta[@name='description']/@content" однако я бы хотел вычеркнуть точное количество сообщений, а не сокращенное число.

1 Ответ

0 голосов
/ 23 сентября 2019

Попробуйте это -

function hashCount() {
  var url = 'instagram.com/explore/tags/cats/';
  var response = UrlFetchApp.fetch(url, {muteHttpExceptions: true}).getContentText();
  var regex = /(edge_hashtag_to_media":{"count":)(\d+)(,"page_info":)/gm;
  var count = regex.exec(response)[2];
  Logger.log(count);
}

Демо -

Instagram Hashtag count

Я добавил muteHttpExceptions: true который не был добавлен в мой комментарий выше.Надеюсь, это поможет.

...