API для получения контактной информации о колледже или университете? - PullRequest
0 голосов
/ 01 марта 2020

Существует множество ресурсов для получения имени, веб-сайта, информации об аккредитации и т. Д. c для высших учебных заведений, таких как API Scorecard College * или IPEDS . Для этого проекта мне нужно найти адрес электронной почты с общей контактной информацией для нескольких сотен колледжей и университетов. Я планирую использовать Google Sheets и Apps Script для сбора этих данных.

У меня есть электронная таблица, такая как

| Name                  | URL                  | City            | State | Email |
|-----------------------|----------------------|-----------------|-------|-------|
| Prairie State College | www.prairiestate.edu | Chicago Heights | IL    |       |
| Langston University   | www.langston.edu     | Langston        | OK    |       |

, где мне нужно заполнить столбец «электронная почта». Кто-нибудь знает какие-либо API, которые могли бы помочь с этим? Быстрый поиск в Google говорит мне, что ldickerson@prairiestate.edu - это контакт в Prair ie State College, тогда как на странице поступления в университет Лангстона есть luadmissions@langston.edu прямо на нем. У кого-нибудь есть идеи, откуда я могу получить эти данные автоматически?

1 Ответ

1 голос
/ 03 марта 2020

Нет прямого API, который мог бы помочь вам достичь этого.

Вместо этого вы можете использовать UrlFetchApp из скрипта приложений и получать текст страницы с требуемых страниц допуска / контакта. После этого вы можете получить адрес электронной почты из текста страницы, полученного с помощью regex.

Приведенный ниже код выполняет упомянутое выше, но в зависимости от страницы может получить более одного адреса электронной почты. Если вы точно знаете, что первое электронное письмо в списке - это адрес электронной почты, который вам действительно нужен, вместо этого вы можете позвонить email[0].

function findMail() {
  var url ="ADMISSION_CONTACT_PAGE_URL";
  var pageText = UrlFetchApp.fetch(url).getContentText();
  var email = pageText.match(/([a-zA-Z0-9._-]+@[a-zA-Z0-9._-]+\.[a-zA-Z0-9_-]+)/gi);
  Logger.log(email);
}

Ссылка

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...