Единственный способ обойти это ограничение на данный момент - написать собственный экстрактор. Тем не менее, вам придется предоставлять данные не в виде строки, а в виде байта [].
Если вы используете пользовательский экстрактор, который просто читает байтовый массив, вы можете получить до 4 МБ.
В общем, если вам нужно проанализировать вашу строку, это будет, вероятно, быстрее, если вы напишите свой собственный экстрактор вместо использования встроенного экстрактора, а затем напишите еще одно преобразование U-SQL или два для анализа данных. (опять же).
Вы можете обратиться к этому репо, возможно, для некоторых идей - https://github.com/Azure/usql/tree/mrys-json