Соскоб в Интернете с помощью Google Script, асинхронного веб-сайта? - PullRequest
0 голосов
/ 25 июня 2019

Я хочу удалить эту конкретную информацию "NM_000014.5" из таблицы стенограмм RefSeq (точнее, я бы хотел, чтобы RefSeq Выберите один) этого веб-сайта https://www.ncbi.nlm.nih.gov/gene/?term=%22A2M%22+human

Я хочу удалить эту информацию, используя скрипт Google, чтобы добавить ее в таблицу листов Google. Я уже смог удалить другую информацию, но эту конкретную информацию мне слишком сложно достать. Я пытался использовать UrlFetchApp.fetch и анализировать с помощью XmlService, но похоже, что эта информация связана с другим веб-сайтом ... или что-то в этом роде ... есть ли "простой" способ получить это?

1 Ответ

1 голос
/ 25 июня 2019

Вы можете попробовать использовать функции IMPORT, которые поставляются с Google Sheets, в частности, ImportXML или ImportHTML.Это отличные варианты, которые я использовал в прошлом для простых сводок сайтов.

Вот отличная статья, посвященная базовому просмотру веб-страниц в Google Sheets с помощью ImportXML: https://www.benlcollins.com/spreadsheets/google-sheet-web-scraper/

Просто щелкните правой кнопкой мышиПроверьте сайт на правильность HTML-тегов.Надеюсь, это поможет немного

...