Мне нужно проверить повторяющееся имя файла в моей таблице, и если количество файлов равно 0, тогда мне нужно загрузить файл в мою таблицу, используя sparkSql
. Я написал ниже код.
val s1=spark.sql("select count(filename) from mytable where filename='myfile.csv'") //giving '2'
s1: org.apache.spark.sql.DataFrame = [count(filename): bigint]
s1.show //giving 2 as output
// s1 дает мне количество файлов из моей таблицы, тогда мне нужно сравнить это значение счетчика, используя оператор if. Я использую приведенный ниже код.
val s2=s1.count //not working always giving 1
val s2=s1.head.count() // error: value count is not a member of org.apache.spark.sql.Row
val s2=s1.size //value size is not a member of Unit
if(s1>0){ //code } //value > is not a member of org.apache.spark.sql.DataFrame
Может кто-нибудь дать мне подсказку, как мне это сделать. Как я могу получить значение dataframe и может использовать в качестве переменной для проверки условия. то есть
if(value of s1(i.e.2)>0){
//my code
}