Как узнать размер самой длинной записи (строки) набора данных в байтах.
У меня довольно большой фрейм данных с переменной длиной записи (строки), и я хочу узнать длину строки с наибольшей полезной нагрузкой.
В нем миллионы \ миллиарды строк, поэтому я хочу знать способ, который эффективен и не повлияет на производительность.
У меня DataFrameWriter в качестве входных данных.