для увеличения производительности этого запроса
df2 = sqldf('select A, B, min(C), max(d), median(E)
from df1
where A = 1
and B = "xyz"
group by A, B')
убедитесь, что у вас есть индекс в таблице df1, столбец A, B
create index my_idx ON df1 (A, B)
или
create index my_idx ON df1 (A, B, C, D,E)
вторым способом .. все значения извлекаются непосредственно из индекса, уменьшающего доступ к таблице данных