Одно из возможных решений:
Используйте wireshark с фильтром tcp port 80 и несколько раз выполните свою задачу вручную. Затем изучите запросы, сделанные вашим браузером в Wireshark.
Затем создайте сценарий с помощью модуля httplib для автоматизации ранее рассмотренных запросов.
Как я знаю, в gmail есть ссылка "Просмотреть как HTML", когда вы получаете вложение в формате PDF. Вы можете использовать это для преобразования документов в Google Документы.