Я выбираю данные столбца в Hive с помощью функции подстроки и указываю длину 3999. Я сохраняю выбранные столбцы в файле BLOB-объектов в Azure, а затем пытаюсь загрузить файл в Azure DataWarehouse с помощью фабрики данных Azure. Теперь я сталкиваюсь с ошибками для нескольких строк, где говорится, что длина данных превысила 3999 (MaxLength).
Итак, для устранения неполадок я сделал подстроку длиной 2000 в Hive и сохранил данные в файл. На этот раз я не получил никаких ошибок. Однако, когда я проверил данные в столбце в DataWarehouse, некоторые элементы имеют длину более 2000. Это в основном происходит из-за данных, поступающих в китайских символах.