Я пытаюсь получить счет таблицы Импалы в pyspark.Но я получаю неправильные результаты в искре.
Таблица impala является секционированной таблицей.Он делится на год и месяц ( EX: 201906 ).Я даже делаю недействительные метаданные, изменяю таблицу, восстанавливаю разделы и обновляю таблицу после обновления таблицы.Но я все еще не получаю правильных результатов в искре.
Выполнение
select count(*) dbname.tablename where timestamp>='2019-06-01' and timestamp<='2019-06-15'
возвращает
10931
и
spark.sql("select count(*) dbname.tablename") where timestamp>='2019-06-01' and timestamp<='2019-06-15'
возвращает
0