Эта проблема может быть воспроизведена на экземпляре сообщества Databricks .
Используя набор данных Airlines, существует папка с большим количеством файлов.Первый файл имеет заголовок, а остальные нет.
Этот оператор создаст таблицу с заголовками:
DROP TABLE IF EXISTS airline;
CREATE TABLE airline
USING CSV
OPTIONS (path "dbfs:/databricks-datasets/airlines/part-00000", header "true")
Этот оператор создаст таблицу без заголовков:
DROP TABLE IF EXISTS airline;
CREATE TABLE airline
USING CSV
OPTIONS (path "dbfs:/databricks-datasets/airlines/part-00001", header "true")
Этот оператор создаст таблицу без заголовков:
DROP TABLE IF EXISTS airline;
CREATE TABLE airline
USING CSV
OPTIONS (path "dbfs:/databricks-datasets/airlines/", header "true")
Есть ли способ контролировать, откуда информация заголовка читается?Существует ли какая-либо документация обо всех возможных параметрах для параметра OPTIONS
?