доступ к ссылке в сообщении электронной почты с помощью API Gmail - PullRequest
0 голосов
/ 03 октября 2018

Я пытаюсь получить доступ к ссылке в моих письмах, которые я получаю в своей учетной записи Gmail с определенного адреса электронной почты.До сих пор, используя GMAIL API, я могу получить идентификатор электронной почты с помощью функции Python ListMessagesMatchingQuery из документации: https://developers.google.com/gmail/api/v1/reference/users/messages/list

Затем я могу получить содержимое электронной почты с помощью функции Python GetMessage издокументация: https://developers.google.com/gmail/api/v1/reference/users/messages/get.

Формат содержимого, однако, недостаточно.То, что я хочу получить, - это ссылка на содержимое электронной почты, чтобы я мог получить доступ к ее HTML-странице и затем очистить ее.

Спасибо

1 Ответ

0 голосов
/ 04 октября 2018

После извлечения содержимого электронной почты из Gmail вы можете использовать библиотеку анализатора электронной почты Python для анализа раздела MIME, который является HTML.См .: https://docs.python.org/3.7/library/email.parser.html

Имея HTML-код, вы можете использовать Beautifulsoup для анализа всего, что вам нужно, см .: https://www.crummy.com/software/BeautifulSoup/bs4/doc/

На приведенной выше странице документации "Одна общая задачаизвлекает все URL-адреса, найденные в тегах страницы ", и вот фрагмент кода:

for link in soup.find_all('a'):
    print(link.get('href'))  

Если библиотека анализатора электронной почты сообщает, что в электронной почте нет компонента HTML, вам придется просмотреть текстищите ссылки (например, ищите "http://" или" https /").

...