Как извлечь файл bz2 в спарк - PullRequest
0 голосов
/ 25 октября 2018

У меня есть csv-файл, заархивированный в формате bz2, как и у unix / linux, есть ли у нас какая-либо однострочная команда для извлечения / распаковки файла file.csv.bz2 в file.csv в spark-scala?

1 Ответ

0 голосов
/ 25 октября 2018

Вы можете использовать встроенную функцию в SparkContext (sc), это работает для меня

sc.textFile("file.csv.bz2").saveAsTextFile("file.csv")
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...