[РЕДАКТИРОВАТЬ] Полный код скрипта приложений здесь:
var html = '<h2><a href="https://www.southwest.com/about/southwest/index.html"><b>About Southwest</b></a></h2>';
var doc = XmlService.parse(html);
var root = doc.getRootElement();
var children = root.getDescendants();
children.forEach(function(ch){
var chelm = ch.asElement();
if(chelm && chelm.getAttribute('href'))
{
var href = chelm.getAttribute('href');
var url = href.getValue();
Logger.log(url);
var hostname;
if (url.indexOf("//") > -1)
hostname = url.split('/')[2];
else
hostname = url.split('/')[0];
hostname = hostname.split('://').pop();
hostname = hostname.split('www.').pop();
hostname = hostname.split('?')[0];
Logger.log(hostname);
}
});
Вы можете использовать XmlService.parse в скрипте приложений и получить атрибут узла ссылки & href: https://sites.google.com/site/scriptsexamples/learn-by-example/parsing-html
Из атрибута href вы можете извлечь домен:
var hostname;
if (url.indexOf("//") > -1)
hostname = url.split('/')[2];
else
hostname = url.split('/')[0];
hostname = hostname.split('://').pop();
hostname = hostname.split('www.').pop();
hostname = hostname.split('?')[0];