Django & Postgres - процентиль (медиана) и группировка по - PullRequest
1 голос
/ 10 января 2020

Мне нужно рассчитать медианы периода для идентификатора продавца (см. Упрощенную модель ниже). Проблема в том, что я не могу построить запрос ORM.

Модель

class MyModel:
    period = models.IntegerField(null=True, default=None)
    seller_ids = ArrayField(models.IntegerField(), default=list)
    aux = JSONField(default=dict)

Запрос

queryset = (
    MyModel.objects.filter(period=25)
    .annotate(seller_id=Func(F("seller_ids"), function="unnest"))
    .values("seller_id")
    .annotate(
        duration=Cast(KeyTextTransform("duration", "aux"), IntegerField()),
        median=Func(
            F("duration"),
            function="percentile_cont",
            template="%(function)s(0.5) WITHIN GROUP (ORDER BY %(expressions)s)",
        ),
    )
    .values("median", "seller_id")
)

Агрегация ArrayField (seller_id) источник


Я думаю, что мне нужно сделать что-то вроде строки ниже

select t.*, p_25, p_75
from t join
     (select district,
             percentile_cont(0.25) within group (order by sales) as p_25,
             percentile_cont(0.75) within group (order by sales) as p_75
      from t
      group by district
     ) td
     on t.district = td.district

над примером источника


Python 3.7.5, Django 2.2.8, Postgres 11.1

1 Ответ

1 голос
/ 11 января 2020

Вот что сделал трюк.

from django.db.models import F, Func, IntegerField
from django.db.models.aggregates import Aggregate


queryset = (
    MyModel.objects.filter(period=25)
    .annotate(duration=Cast(KeyTextTransform("duration", "aux"), IntegerField()))
    .filter(duration__isnull=False)
    .annotate(seller_id=Func(F("seller_ids"), function="unnest"))
    .values("seller_id")  # group by
    .annotate(
        median=Aggregate(
            F("duration"),
            function="percentile_cont",
            template="%(function)s(0.5) WITHIN GROUP (ORDER BY %(expressions)s)",
        ),
    )
)

Обратите внимание, что в аннотации median используется Aggregate, а не Func, как в вопросе. Кроме того, порядок предложений annotate () и filter () , а также порядок предложений annotate () и values ​​() очень важен !

Кстати, полученный SQL без вложенного выбора и соединения.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...