Сгруппируйте изображения в папку с metadata.csv - AzureDataFactory или AzureDatabricks - PullRequest
0 голосов
/ 16 апреля 2020


У меня есть 100 000 изображений в одной папке (плохой раздел, но это так). Существует CSV с функциями и путями к изображениям.

  1. Каков наилучший способ разбить эту папку с 1 изображением на N, скажем, 200 папок, а также обновить metadata.csv с обновленным путем?

  2. Текущий подход к базам данных: image_df = spark.read.format ("image"). load ("/ mnt / images / *" , inferschema = True) ** Q: ** Не знаете, как написать изображения для разделения папок отсюда?

  3. Как добиться того же в AzureDataFactory?

Спасибо.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...