После прочтения исходного кода кажется, что чтение CSV лениво, если опция inferSchema отключена:
Если схема не указана с использованием функции schema
и опция inferSchema
включена, эта функцияпроходит через вход один раз, чтобы определить схему ввода.
Если схема не указана с использованием функции schema
и опция inferSchema
отключена, столбцы определяются как строковые типы и считываются только в первой строке. чтобы определить имена и количество полей.
Если для параметра forceceSchema установлено значение false
, проверяется только заголовок CSV в первой строке на соответствие указанной или предполагаемой схеме.