Создание фрейма данных из текстовых файлов, в pyspark не работает - PullRequest
0 голосов
/ 01 мая 2020

Ниже приведен код для чтения списка файлов данных, разделенных символом ^ во фрейм данных. Однако каждое поле загружается как отдельная строка вместо чтения строки за строкой.

Другими словами, одна строка содержит только одно поле, а не все поля строки.

Это делается внутри python искры блоков данных.

Поля разделены ^.

df = spark.read.text(paths='path/srcfilepath',lineSep='^')

1 Ответ

1 голос
/ 01 мая 2020

Используйте spark.read.csv вместо text с разделителем , опцией ^

spark.read.option("delimiter","^").csv("path/srcfilepath").show()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...