PySpark читает текстовый файл в одном столбце данных - PullRequest
0 голосов
/ 13 сентября 2018

У меня есть текстовый файл, который я хотел бы прочитать в кадре данных.Я предпочитаю читать это в одной колонке.Это работало, пока я не наткнулся на файл с ^ в нем.

raw = spark.read.option("delimiter", "^").csv(data_dir + pair[0])

Но, увы, случайно, следующий раз сломал шаблон.Я не вижу опции для delimiter None.Есть ли эффективный способ сделать это?

1 Ответ

0 голосов
/ 13 сентября 2018

Вы смотрели на использование spark.read.textFile вместо этого? Он может делать то, что вы хотите.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...