Можете ли вы удалить UUID в разделенных паркетных файлах? - PullRequest
0 голосов
/ 27 марта 2019

Мы храним некоторые данные в многораздельных паркет-файлах для клиента. Хотя это работает без проблем, клиент столкнулся с проблемами через ограничение в 255 символов в пути к файлу из окон. Структура папок, которая используется для секционированных данных, позволяет четко идентифицировать хранимые данные. Изменение структуры папок клиента на самом деле не вариант.

Идея, которую мы имеем, состоит в том, чтобы сократить имя файла, удалив UUID, в лучшем случае при создании файла, если это невозможно, переименовав его впоследствии.

Окружающая среда может быть кратко изложена следующим образом:

  • Кластер блоков данных с ноутбуками Python
  • Файлы хранятся в озере данных Azure

Enivormentdata для используемого Python:

  • Компилятор: GCC 5.4.0 20160609
  • Сборка: («по умолчанию», «23 ноября 2017 г. 16:37:01»)
  • Реализация: CPython Python Версия: 3.5.2
...