Я использую Spark с scala 2.4.
spark.sqlContext.sql("set spark.sql.caseSensitive=false")
spark.sql("select Distinct p.Area,c.Remarks from mytable c join areatable p on c.id=p.id where c.remarks = 'Sufficient Amounts'")
Я использовал Distinct даже тогда, когда я получаю 3 записи для каждой отдельной записи.
DISTRICT_1| Sufficient Amounts
District_1| Sufficient Amounts
district_1| Sufficient Amounts
DISTRICT_10|Sufficient Amounts
District_10|Sufficient Amounts
district_10|Sufficient Amounts
Даже если я установил явно spark.sqlContext.sql("set spark.sql.caseSensitive=false").
Ожидаемый результат:
DISTRICT_1 |Sufficient Amounts
DISTRICT_10 |Sufficient Amounts
Нужно ли мне что-то устанавливать. Пожалуйста, поделитесь своими мыслями.