Я выполняю 100 запросов (тестовых случаев), чтобы проверить качество данных в Spark Scala. Я запрашиваю данные из таблицы улья.
Ожидаемый результат для этих примеров запросов - пустой фрейм данных:
SELECT car_type FROM car_data WHERE car_version is null
SELECT car_color FROM car_data WHERE car_date is null
SELECT car_sale FROM car_data WHERE car_timestamp is null
Я хочу написать, если контрольный пример пройден или не выполнен на основеожидаемый результат в текстовый файл. Я хочу знать, как лучше всего это сделать.
Что у меня есть:
val test_1 = context.sql("SELECT car_type FROM car_data WHERE car_version is null")
val test_2 = context.sql("SELECT car_color FROM car_data WHERE car_date is null")
val test_3 = context.sql("SELECT car_sale FROM car_data WHERE car_timestamp is null")
test_1.head(1).isEmpty