Проблема записи не-ascii контента на S3 - PullRequest
0 голосов
/ 13 марта 2019

У меня есть следующие функции в узле:

  1. Считывание html-содержимого из веб-URL
  2. Преобразование содержимого в pdf с использованием пакета html-pdf (с использованием потоков)
  3. Загрузка содержимого в s3 с использованием этого потока в качестве тела

Когда HTML-код содержит символы, отличные от ASCII, например содержимое на китайском или корейском языке, загруженный PDF-файл показывает пустым для этих символов

Если я попытаюсь записать файл в файл локально, сохраненный PDF-файл правильно отобразит содержимое.

Я попытался установить ContentEncoding в UTF-8, все еще смотря на него правильно.

1 Ответ

0 голосов
/ 15 марта 2019

Самое простое решение - создать файл локально, а затем скопировать его в Amazon S3.

Вот пример на Python:

import boto3
s3 = boto3.client('s3')
s3.upload_file('/tmp/hello.txt', 'mybucket', 'hello.txt')

Обязательно удалите файл после загрузки, чтобы обеспечить место для хранения в будущем.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...