Получить вложение Gmail в Python с помощью Gmail API в Python3 .7 - PullRequest
0 голосов
/ 08 мая 2020

Я пытаюсь автоматизировать процесс, получая и загружая вложение csv из почтового сообщения Gmail, перед тем как запустить процесс для этого файла csv. Я считаю, что большая часть документации либо трудна для понимания, либо не применима к более поздним версиям Python.

Я использую следующий код для получения идентификаторов почты. В настоящее время он компилируется без ошибок в PyCharm и возвращает некоторые результаты при выполнении в Терминале с использованием i Python:

#!/usr/bin/env python3

import pickle
import os.path
import email
import base64
from googleapiclient.discovery import build
from google_auth_oauthlib.flow import InstalledAppFlow
from google.auth.transport.requests import Request
from apiclient import errors



# If modifying these scopes, delete the file token.pickle.
SCOPES = ['https://www.googleapis.com/auth/gmail.readonly']
store_dir = os.getcwd()

# USE MESSAGE ID TO GET EMAIL
def get_message(service, user_id, msg_id):

    try:
        message = service.users().messages().get(userId=user_id, id=msg_id, format='raw').execute()

        msg_raw = base64.urlsafe_b64decode(message['raw'].encode('ASCII'))

        msg_str = email.message_from_bytes(msg_raw)

        content_types = msg_str.get_content_maintypes()

        if content_types == 'multipart':
            #part1 is plain text, part2 is HTML
            part1, part2 = msg_str.get_payload()
            print("This is the message body: ")
            print(part1.get_payload())
            return part1.get_payload()
        else:
            return msg_str.get_payload()

    except (errors.HttpError, error):
        print("An error occurred: %s") % error



# SEARCH FOR MESSAGE ID
def search_mail(service, user_id, search_string):
    try:

        search_id = service.users().messages().list(userId=user_id, maxResults=20,labelIds = ['INBOX'], q=search_string).execute()

        num_results = search_id['resultSizeEstimate']

        result_list()
        if number_results>0:
           message_ids = search_id['messages']

        for ids in message_ids:
            num_results.append(ids['id'])

            return result_list
        else:
            print('There were 0 results for your search string. Returns empty')
            return ""

    except (errors.HttpError, error):
        print("An error occurred: %s") % error

def get_service():
    creds = None
    # The file token.pickle stores the user's access and refresh tokens, and is
    # created automatically when the authorization flow completes for the first
    # time.
    if os.path.exists('token.pickle'):
        with open('token.pickle', 'rb') as token:
            creds = pickle.load(token)
    # If there are no (valid) credentials available, let the user log in.
    if not creds or not creds.valid:
        if creds and creds.expired and creds.refresh_token:
            creds.refresh(Request())
        else:
            flow = InstalledAppFlow.from_client_secrets_file(
                'credentials.json', SCOPES)
            creds = flow.run_local_server(port=0)
        # Save the credentials for the next run
        with open('token.pickle', 'wb') as token:
            pickle.dump(creds, token)

    service = build('gmail', 'v1', credentials=creds)

    return service


def GetAttachments(service, user_id, msg_id): #store_dir):
  """Get and store attachment from Message with given id.

  Args:
    service: Authorized Gmail API service instance.
    user_id: User's email address. The special value "me"
    can be used to indicate the authenticated user.
    msg_id: ID of Message containing attachment.
    store_dir: The directory used to store attachments.
  """
  try:
      message = service.users().messages().get(userId=user_id, id=msg_id).execute()

      for part in message['payload']['parts']:
          if part['filename']:
              attachment = service.users().messages().attachments().get(userId='me', messageId=message['id'],
                                                                        id=part['body']['attachmentId']).execute()
              file_data = base64.urlsafe_b64decode(attachment['data'].encode('UTF-8'))

              path = ''.join([store_dir, part['filename']])

              f = open(path, 'wb')
              f.write(file_data)
              f.close()


  except errors.HttpError as error:
      print(f'An error occurred: {error}')

Мои проблемы:

  1. Непонятно мне, где я могу ввести свои критерии поиска / строку. Электронное письмо приходит каждый день, а имя файла всегда одно и то же, поэтому мне нужен способ указать имя файла необходимого вложения, чтобы извлекалось только соответствующее сообщение. В настоящее время я просто извлекаю последние 20 сообщений, что не является достаточно обязательным.

  2. Я использую store_dir = os.getcwd(), чтобы вручную объявить путь к файлу назначения для вложения (т.е. просто рабочий каталог этого проекта), однако неудивительно, что файл в настоящее время не сохраняется в указанном месте.

  3. Мне нужно, чтобы файл был импортирован, читался и обрабатывался уже существующий сценарий, который сохраняется в другом файле .py. Этот процесс был написан в блокноте jupyter, где я смог убедиться, что он работает, когда CSV импортируется вручную.

Любые указания приветствуются.

1 Ответ

0 голосов
/ 11 мая 2020

Учитывая, что:

  • Имя прикрепленного файла всегда одно и то же.
  • Электронное письмо приходит каждый день.

Вместо перечисляя последние 20 сообщений, вы можете использовать поисковый запрос (q), чтобы найти нужное сообщение, используя следующие операторы поиска , которые работают так же, как в интерфейсе Gmail:

search_query = "newer_than:1d filename:{your-attachment-name}"
search_id = service.users().messages().list(userId=user_id, maxResults=20,labelIds = ['INBOX'], q=search_query).execute()

Что касается загрузки вложения, я бы просто следил за этим .

Ссылка:

...