Я пытаюсь перевести запрос SQL для использования RAPIDS.Рассмотрим упрощенный запрос ниже:
(SELECT min(a), max(b), c
FROM T
GROUP BY c) AS result
Я проверил приведенный ниже код, но является ли это оптимальным решением?Нужна ли сортировка по групповому ключу?Есть ли более чистый / более идиоматический способ написать это?
from pygdf import DataFrame as gdf
T = gdf(...)
df = gdf({'a':T.a, 'c':T.c}).groupby('c').min().sort_values(by='c')
df['max_b'] = gdf({'b':T.b, 'c':T.c}).groupby('c').max().sort_values(by='c').max_b
result = gdf({'a': df.min_a, 'b': df.max_b, 'c':df.c})