Мне нужно импортировать файл CSV, который содержит несколько полей, позже я должен выполнить цикл по некоторым интересующим нас полям, чтобы восстановить содержащиеся в нем данные.
В этом файле есть поле с именем query, содержащееЗапросы SQL, которые должны быть выполнены и сохранены в другом файле CSV, который будет содержать поля для извлечения, а также результаты каждого запроса.
Ниже приведен мой код:
// step1:read the file
val table_requete = spark.read.format("com.databricks.spark.csv").option("header","true").option("delimiter", ";").load("/user/swychowski/ClientAnlytics_Controle/00_Params/filtre.csv")
req.registerTempTable("req")
// step2:read the file
Однако я не знаю, как зациклить и сохранить другой файл одновременно.