Я не хочу использовать схему схемы и параметры заголовков. Единственный способ - прочитать файл, содержащий только заголовки столбцов, и использовать его динамически для создания кадра данных.
Я использую Spark 2 и для загрузки одного CSV-файла с моей определенной пользователем схемой, но я хочу обрабатывать это динамически, так что, как только я укажу путь только к файлу схемы, он будет читать его и использовать в качестве заголовков для данные и преобразовать их в датафрейм с помощью схемы, предоставленной в файле схемы.
Предположим, в предоставленной мной папке содержится 2 файла. Один файл будет содержать только данные, заголовок не обязателен. Второй файл будет иметь схему (имена столбцов). Поэтому я должен сначала прочитать файл схемы, а затем файл, содержащий данные, и применить схему к файлу данных и показать ее в фрейме данных.
Небольшой пример, schema.txt содержит:
Custid,Name,Product
в то время как файл данных имеет:
1,Ravi,Mobile