Я использую Scala 2.11, и у меня версия spark 2.4.4. У меня есть запрос ниже из набора json файлов.
import org.apache.spark.sql.types.{StructType, StructField, IntegerType, StringType, ArrayType, FloatType, TimestampType}
val schema =
StructType(
List(
StructField("SMS",StringType,false),
StructField("SMSCorrupt", StringType, false)
))
val SMSCorruptDF = spark.read
.schema(schema)
.option("mode", "PERMISSIVE")
.option("columnNameOfCorruptRecord", "SMSCorrupt")
.json("/mnt/UbiqLog4UCI/14_F/log_1-6-2014.txt")
//.na.drop()
display(SMSCorruptDF)
Мой результат похож на изображение ниже:
Мне нужно иметь только строки, в которых по крайней мере один из моих столбцов содержит данные. когда я выполнял свой запрос с помощью .na.drop (), результат был пустым.