Несколько вопросов о Google Data Fusion - PullRequest
1 голос
/ 25 июня 2019

Я открываю для себя инструмент, и у меня есть несколько вопросов:

- что именно вы подразумеваете под типом File в (Source, Sink), - также возможно отправить результат конвейера напрямую на FTP-сервер

Я проверяю документацию, но не нашел эту информацию

спасибо

1 Ответ

5 голосов
/ 29 июня 2019

Краткий ответ: Файл относится к файловой системе, в которой работают конвейеры. В контексте Data Fusion, если вы используете приемник файлов, содержимое будет записано в HDFS в кластере Dataproc.

Data Fusion имеет SFTP-действия, которые можно использовать для записи в SFTP. Вот простой конвейер того, как писать в SFTP из GCS.

enter image description here

Шаг 1: Исходный файл GCS для приемника файлов - записывает содержимое GCS в HDFS в Dataproc при запуске конвейера Шаг 2: действие SFTP Put, которое берет выходные данные из приемника файла и загружает его в SFTP.

Необходимо настроить путь вывода файла так же, как исходный путь в SFTP

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...