проверить, является ли CSV-файл пустым или нет в спарк-скале - PullRequest
0 голосов
/ 27 апреля 2018

Я хочу проверить, является ли .csv null или нет. Если не null и содержит запись, обработайте файл, иначе выйдите. Есть ли способ проверить в Spark Scala код, если файл пуст или нет?

Ответы [ 2 ]

0 голосов
/ 27 апреля 2018

Считать этот файл в фрейм данных

Val df = spark.read.csv("filename") df.rdd.isEmpty

0 голосов
/ 27 апреля 2018

Как я понимаю, вы хотите проверить, существует ли файл CSV.

Если это локальная система, вы просто используете библиотеку Java:

import java.nio.file.{Paths, Files}
Files.exists(Paths.get("yourPath/file.csv"))

если CSV на HDFS, то:

val conf = sc.hadoopConfiguration
val fs = org.apache.hadoop.fs.FileSystem.get(conf)
val exists = fs.exists(new org.apache.hadoop.fs.Path("/path/on/hdfs/to/your.csv"))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...