Доступ к файлу docx, хранящемуся в корзине aws -s3 из python -docx - PullRequest
0 голосов
/ 28 января 2020

У меня есть файл docx в моем aws -s3 ведре. Мне нужно прочитать это использовать python -docx. Я пишу это:

from docx import Document
document = Document('https://my-first-backup-bucket-v1.s3-ap-southeast-1.amazonaws.com/New+Proposed+Quote.docx')

, то есть ошибка .. PackageNotFoundError: Пакет не найден в 'https://my-first-backup-bucket-v1.s3-ap-southeast-1.amazonaws.com/New+Proposed+Quote.docx'

почему?

когда я пытался получить доступ к тому же файлу из браузера, он успешно открывается. Для целей тестирования я создал этот файл с доступом publi c. Кто угодно может проверить это, может кто-нибудь помочь с этим?

1 Ответ

1 голос
/ 29 января 2020

Из Объекты документа - python -docx 0.8.10 документация :

docx.Document(docx=None)

Возвращает объект документа, загруженный из docx, где docx может быть либо путем к файлу .docx (строка), либо файловым объектом. Если docx отсутствует или отсутствует, загружается встроенный «шаблон» документа по умолчанию.

Это говорит о том, что указанное имя файла должно указывать на локальный файл . Он не говорит о том, что URL-адрес принят.

Поэтому следует загрузить файл из Amazon S3, а затем указать на него в локальной файловой системе.

...