Question

Мы должны прослушивать каталог в datalake, и когда добавляется новый файл, модуль данных должен его прочитать и провести некоторый анализ.

Либо мы можем получить кластер заданий и, используя потоковую передачу структуры, непрерывно контролировать каталог. Это решение должно работать, но здесь кластер заданий будет работать вечно. Вместо этого есть способ, которым сама datalake может запускать кластер заданий databricks при добавлении нового файла в его каталог.

Предоставляет ли озеро данных azure способ начать работу по сборке данных

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Предоставляет ли озеро данных azure способ начать работу по сборке данных

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы