Question

У меня есть файл CSV, и когда я загружаю его в блоки данных с помощью Pyspark, он теряет свою структуру. Я попытался разграничить то же самое с помощью pipe и установить header = True, но ничего не вышло. Ниже то, с чем я столкнулся, и это только пример:

Я написал следующий код:

df = spark.read.csv(df_path, header = True, sep = "|")

, и результат:

----------------------------------
region, sub-region, country, owner
----------------------------------
new_jersey, daffodil, USA, Anker
Dubai, Bahamas, UAE, Nikon

Все значения попадают в один столбец и разделяются знаком «,». Как преобразовать то же самое во фрейм структурированных данных?

Как разделить значения в разные столбцы в pyspark?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Как разделить значения в разные столбцы в pyspark?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы