Я пытаюсь отфильтровать этот текстовый файл
TotalCost|BirthDate|Gender|TotalChildren|ProductCategoryName
1000||Male|2|Technology
2000|1957-03-06||3|Beauty
3000|1959-03-06|Male||Car
4000|1953-03-06|Male|2|
5000|1957-03-06|Female|3|Beauty
6000|1959-03-06|Male|4|Car
Я просто хочу отфильтровать каждый необработанный файл и удалить его, если в столбце есть нулевой элемент.
В моем образце набора данных естьтри из них, которые являются нулевыми.
Однако я получаю и очищаю данные, когда запускаю код.Я что-то пропустил?
Это мой код в scala
import org.apache.spark.sql.SparkSession
object DataFrameFromCSVFile {
def main(args:Array[String]):Unit= {
val spark: SparkSession = SparkSession.builder()
.master("local[*]")
.appName("SparkByExample")
.getOrCreate()
val filePath="src/main/resources/demodata.txt"
val df = spark.read.options(Map("inferSchema"->"true","delimiter"->"|","header"->"true")).csv(filePath)
df.where(!$"Gender".isNull && !$"TotalChildren".isNull).show
}
}
Проект на IntelliJ
Большое спасибо