Как извлечь атрибут "href" <a>и вставить его в лист Google? - PullRequest
0 голосов
/ 01 марта 2020

Я хотел бы извлечь атрибут "href" HTML якоря ( Ссылка здесь ) со следующей страницы:

https://tvm.liga.nu/cgi-bin/WebObjects/nuLigaTENDE.woa/wa/teamPortrait?team=2368692&championship=K%C3%B6ln-Leverkusen+Winter+2019%2F2020&group=18

и поместите его в свой лист google.

Я пробовал несколько выражений xpath для этой страницы, но это всегда "N / A".

Тем не менее простой xpath не работает, например

importxml("https://tvm.liga.nu/cgi-bin/WebObjects/nuLigaTENDE.woa/wa/teamPortrait?team=2368692&championship=K%C3%B6ln-Leverkusen+Winter+2019%2F2020&group=18";"//tr")

Что я делаю не так?

1 Ответ

1 голос
/ 05 марта 2020

Спасибо Танаике за все твои усилия.

Я немного изменил сценарий, потому что результат основан на чистом html и должен быть изменен, чтобы можно было щелкнуть ссылку.

function getWebsite(url, searchText, baseURL)
{
  var html = UrlFetchApp.fetch(url);
  var text = html.getContentText();

  var re = new RegExp('(?<=<a href=")(.*)(?=">.*' + searchText +')',"g");

  var link = text.match(re)[0];

  if (link !== null) 
  {
    var link = text.match(re);
    link = link.replace(/&amp;/g,"&");
    link = link.replace(/&quot;/g,"\"");

    return baseURL + link;
  }
  else { return "not found"; }
}
...