Мы храним некоторые данные в многораздельных паркет-файлах для клиента. Хотя это работает без проблем, клиент столкнулся с проблемами через ограничение в 255 символов в пути к файлу из окон. Структура папок, которая используется для секционированных данных, позволяет четко идентифицировать хранимые данные.
Изменение структуры папок клиента на самом деле не вариант.
Идея, которую мы имеем, состоит в том, чтобы сократить имя файла, удалив UUID, в лучшем случае при создании файла, если это невозможно, переименовав его впоследствии.
Окружающая среда может быть кратко изложена следующим образом:
- Кластер блоков данных с ноутбуками Python
- Файлы хранятся в озере данных Azure
Enivormentdata для используемого Python:
- Компилятор: GCC 5.4.0 20160609
- Сборка: («по умолчанию», «23 ноября 2017 г. 16:37:01»)
- Реализация: CPython Python Версия: 3.5.2