pythonUser 22 марта 2019 18

Как прочитать CSV-файл, для которого данные содержат двойные кавычки и разделенные запятыми, используя спрей данных в кадрах данных

pythonUser / 22 марта 2019

Я пытаюсь прочитать CSV-файл, используя спарк-фрейм данных в кирпичах данных. CSV-файл содержит двойные кавычки с разделенными запятыми столбцами. Я попытался с приведенным ниже кодом и не смог прочитать файл CSV. Но если я проверю файл в datalake, я смогу увидеть файл.

Вход и выход следующие:

df = spark.read.format("com.databricks.spark.csv")\
     .option("header","true")\
     .option("quoteAll","true")\
     .option("escape",'"')\
     .csv("mnt/A/B/test1.csv")

Данные входного файла: заголовок:

"A","B","C"
"123","dss","csc"
"124","sfs","dgs"

Выход:

"A"|"B"|"C"|

...

Как прочитать CSV-файл, для которого данные содержат двойные кавычки и разделенные запятыми, используя спрей данных в кадрах данных

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Как прочитать CSV-файл, для которого данные содержат двойные кавычки и разделенные запятыми, используя спрей данных в кадрах данных

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы