Google Scripts - Поиск HTML по классам - PullRequest
0 голосов
/ 28 июня 2018

Итак, я написал скрипт на python, который очищает мою электронную почту для данных. Я использовал следующий код для поиска предметов по классу:

HRDataUnClean = str(soup.findAll("h2", {"class": "numbers"}))

Это работало невероятно хорошо, однако, поскольку я использую GMail, и некоторые люди жаловались на установку Python и использование API Google, я хотел написать скрипт на листах Google, который выполняет аналогичную задачу.

Я знаю, как получить тело письма с:

var html = messages[0].getBody()

Однако это возвращает строку, а не html-объект, как я делал раньше с pythons beautifulsoup. Я нашел код скрипта Google для поиска по элементам класса SearchByClass

Однако для XmlService.parse (html) необходим объект html. Можно ли как-то преобразовать тело письма из строки в html-объект?

1 Ответ

0 голосов
/ 02 января 2019

Нет ничего похожего на HTML, представляющий объект в GAS (2019) с аналогичным представлением HTML, как в консоли браузера или объектах JQUERY.

Служба XML устарела, но она все еще работает и принимает в качестве входных данных строку.

var pageHtmlString = UrlFetchApp.fetch(webAddressUrl);
var doc = Xml.parse(pageHtmlString, true);
var bodyHtml = doc.html.body.toXmlString();
doc = XmlService.parse(bodyHtml);
var root = doc.getRootElement();

Примечание. Это решение может не работать, если старый Xml.parse полностью удален из сценариев Google.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...