TensorFlow Transform Python с использованием AWS S3 в качестве источника данных - PullRequest
0 голосов
/ 11 января 2019

Я пытаюсь запустить TensorFlow Transform, используя Python, Apache Flink в качестве Beam Runner. Я заметил, что Beam не имеет AWS S3 в качестве разъема io, и хотел бы узнать, как это обойти.

Вот список поддерживаемых разъемов io, но Python + S3 даже не включен в план.

Я могу вспомнить две работы вокруг:

  1. смонтировать ведро S3 как локальный диск к экземпляру EC2
  2. Напишите мой собственный соединитель Python S3, используя их руководство .

Я хочу знать, есть ли другой творческий (легкий) выход.

Спасибо!

...