Как сделать подзапрос Postgresql в предложении select с предложением join from, как SQL Server? - PullRequest
68 голосов
/ 09 июня 2010

Я пытаюсь написать следующий запрос на postgresql:

select name, author_id, count(1), 
    (select count(1)
    from names as n2
    where n2.id = n1.id
        and t2.author_id = t1.author_id
    )               
from names as n1
group by name, author_id

Это, безусловно, будет работать на Microsoft SQL Server, но совсем не работает на postegresql. Я немного прочитал его документацию, и, кажется, я мог бы переписать его как:

select name, author_id, count(1), total                     
from names as n1, (select count(1) as total
    from names as n2
    where n2.id = n1.id
        and n2.author_id = t1.author_id
    ) as total
group by name, author_id

Но это возвращает следующую ошибку на postegresql: «подзапрос в FROM не может ссылаться на другие отношения того же уровня запроса». Так что я застрял. Кто-нибудь знает, как мне этого добиться?

Спасибо

Ответы [ 5 ]

98 голосов
/ 09 июня 2010

Я не уверен, что прекрасно понимаю ваши намерения, но, возможно, следующее будет близко к тому, что вы хотите:

select n1.name, n1.author_id, count_1, total_count
  from (select id, name, author_id, count(1) as count_1
          from names
          group by id, name, author_id) n1
inner join (select id, author_id, count(1) as total_count
              from names
              group by id, author_id) n2
  on (n2.id = n1.id and n2.author_id = n1.author_id)

К сожалению, это добавляет требование сгруппировать первый подзапрос по id, а также по имени и author_id, что, я думаю, не требуется. Я не уверен, как обойти это, так как вам нужно иметь доступный идентификатор, чтобы присоединиться ко второму подзапросу. Возможно, кто-то еще найдет лучшее решение.

Делись и наслаждайся.

12 голосов
/ 09 июня 2010

Я просто отвечаю здесь с отформатированной версией финальной версии sql, которая мне нужна, основываясь на ответе Боба Джарвиса, который опубликован в моем комментарии выше:

select n1.name, n1.author_id, cast(count_1 as numeric)/total_count
  from (select id, name, author_id, count(1) as count_1
          from names
          group by id, name, author_id) n1
inner join (select author_id, count(1) as total_count
              from names
              group by author_id) n2
  on (n2.author_id = n1.author_id)
6 голосов
/ 24 марта 2018

Дополнение @ Боб Джарвис и @ dmikam ответ, Postgres не выполняет хороший план, если вы не используете LATERAL, ниже симуляции, в обоих случаях данные запроса результаты одинаковые, но стоимость очень разная

Структура стола

CREATE TABLE ITEMS (
    N INTEGER NOT NULL,
    S TEXT NOT NULL
);

INSERT INTO ITEMS
  SELECT
    (random()*1000000)::integer AS n,
    md5(random()::text) AS s
  FROM
    generate_series(1,1000000);

CREATE INDEX N_INDEX ON ITEMS(N);

Выполнение JOIN с GROUP BY в подзапросе без LATERAL

EXPLAIN 
SELECT 
    I.*
FROM ITEMS I
INNER JOIN (
    SELECT 
        COUNT(1), n
    FROM ITEMS
    GROUP BY N
) I2 ON I2.N = I.N
WHERE I.N IN (243477, 997947);

Результаты

Merge Join  (cost=0.87..637500.40 rows=23 width=37)
  Merge Cond: (i.n = items.n)
  ->  Index Scan using n_index on items i  (cost=0.43..101.28 rows=23 width=37)
        Index Cond: (n = ANY ('{243477,997947}'::integer[]))
  ->  GroupAggregate  (cost=0.43..626631.11 rows=861418 width=12)
        Group Key: items.n
        ->  Index Only Scan using n_index on items  (cost=0.43..593016.93 rows=10000000 width=4)

Использование LATERAL

EXPLAIN 
SELECT 
    I.*
FROM ITEMS I
INNER JOIN LATERAL (
    SELECT 
        COUNT(1), n
    FROM ITEMS
    WHERE N = I.N
    GROUP BY N
) I2 ON 1=1 --I2.N = I.N
WHERE I.N IN (243477, 997947);

Результаты

Nested Loop  (cost=9.49..1319.97 rows=276 width=37)
  ->  Bitmap Heap Scan on items i  (cost=9.06..100.20 rows=23 width=37)
        Recheck Cond: (n = ANY ('{243477,997947}'::integer[]))
        ->  Bitmap Index Scan on n_index  (cost=0.00..9.05 rows=23 width=0)
              Index Cond: (n = ANY ('{243477,997947}'::integer[]))
  ->  GroupAggregate  (cost=0.43..52.79 rows=12 width=12)
        Group Key: items.n
        ->  Index Only Scan using n_index on items  (cost=0.43..52.64 rows=12 width=4)
              Index Cond: (n = i.n)

Моя версия Postgres PostgreSQL 10.3 (Debian 10.3-1.pgdg90+1)

5 голосов
/ 19 марта 2018

Я знаю, что это старый, но с Postgresql 9.3 есть возможность использовать ключевое слово "LATERAL", чтобы использовать СВЯЗАННЫЕ подзапросы внутри JOINS, поэтому запрос из вопроса будет выглядеть так:

SELECT 
    name, author_id, count(*), t.total
FROM
    names as n1
    INNER JOIN LATERAL (
        SELECT 
            count(*) as total
        FROM 
            names as n2
        WHERE 
            n2.id = n1.id
            AND n2.author_id = n1.author_id
    ) as t ON 1=1
GROUP BY 
    n1.name, n1.author_id
0 голосов
/ 11 марта 2019
select n1.name, n1.author_id, cast(count_1 as numeric)/total_count
  from (select id, name, author_id, count(1) as count_1
          from names
          group by id, name, author_id) n1
inner join (select distinct(author_id), count(1) as total_count
              from names) n2
  on (n2.author_id = n1.author_id)
Where true

используется distinct, если больше внутреннего соединения, так как производительность группы присоединения ниже

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...