SQL: группировать 2 таблицы как 1 с объединением, объединением, а затем? - PullRequest
3 голосов
/ 22 мая 2009

У меня есть 5 таблиц:

клиенты id - имя

p_orders id - id_customer - код - дата

p_items id - id_order - описание - цена

и h_orders и h_items, которые являются точной копией p_orders и p_items.

Когда таблицы p_ достигают большого количества строк, я перемещаю самые старые в таблицы h_ ... они должны быть в истории.

Итак, моя проблема: как извлечь данные из таблиц p_ и h_, рассматривая их как одну уникальную таблицу ?

Например, я хочу получить количество заказов для каждого клиента и общую стоимость ( всех заказов клиента ), и я использую этот запрос:

SELECT
    customer.id,
    customer.name,
    count(DISTINCT p_orders.id) AS num_orders,
    sum(p_items.price) AS total_money
FROM
    customer
    INNER JOIN p_orders ON p_orders.id_customer = customer.id
    INNER JOIN p_items ON p_items.id_order = p_orders.id
GROUP BY
    customer.id,
    customer.name,
    p_orders.id_customer
ORDER BY
    customer.id

это работает только для одного «набора» таблиц (p_ или h _) .. но я хочу их обоих.

Я пытался использовать СОЮЗ:

(
    SELECT
        customer.id,
        customer.name,
        count(DISTINCT p_orders.id) AS num_orders,
        sum(p_items.price) AS total_money
    FROM
        customer
        INNER JOIN p_orders ON p_orders.id_customer = customer.id
        INNER JOIN p_items ON p_items.id_order = p_orders.id
    GROUP BY
        customer.id,
        customer.name,
        p_orders.id_customer
)
UNION
(
    SELECT
        customer.id,
        customer.name,
        count(DISTINCT h_orders.id) AS num_orders,
        sum(h_items.price) AS total_money
    FROM
        customer
        INNER JOIN h_orders ON h_orders.id_customer = customer.id
        INNER JOIN h_items ON h_items.id_order = h_orders.id
    GROUP BY
        customer.id,
        customer.name,
        h_orders.id_customer
)
ORDER BY id ASC

Это работает, но если у клиента есть заказы как в таблицах p_, так и в таблицах h_, у меня будет 2 строки для этого клиента с 2 различными num_orders и total_money (соответственно, из таблиц p_ и h_ таблиц)

Я пытался добавить идентификатор GROUP BY вне объединения:

(
    --SELECT 2
)
UNION
(
    --SELECT 1
)
GROUP BY id
ORDER BY id ASC

, но запрос не выполняется с ОШИБКА: синтаксическая ошибка в или около «GROUP» в символе 948 , похоже, что GROUP BY не может использоваться таким образом.

Есть предложения?

EDIT:

Для uriDium, да, все таблицы имеют столбец id в качестве первичного ключа, а упомянутые поля (aka p_orders.id_customer) также являются внешними ключами. Вот тестовый дамп структуры базы данных (я добавил некоторые индексы и внешние ключи после создания таблицы, но я не думаю, что это что-то значит):

CREATE TABLE customer (
    id serial NOT NULL,
    name character(50)
);
CREATE TABLE p_orders (
    id serial NOT NULL,
    id_customer integer NOT NULL,
    date date DEFAULT now(),
    code character(5)
);
CREATE TABLE p_items (
    id serial NOT NULL,
    id_order integer NOT NULL,
    descr character(250),
    price money
);
CREATE TABLE h_orders (
    id integer NOT NULL,
    id_customer integer NOT NULL,
    date date,
    code character(5)
);
CREATE TABLE h_items (
    id integer NOT NULL,
    id_order integer NOT NULL,
    descr character(250),
    price money
);
CREATE UNIQUE INDEX id_h_orders ON h_orders USING btree (id);
CREATE INDEX id_h_o_c ON h_orders USING btree (id_customer);
CREATE UNIQUE INDEX id_items_h ON h_items USING btree (id);
CREATE INDEX id_ordinr_dsve ON h_items USING btree (id_order);

ALTER TABLE ONLY customer
    ADD CONSTRAINT customer_pkey  (id);
ALTER TABLE ONLY p_orders
    ADD CONSTRAINT p_orders_pkey PRIMARY KEY (id);
ALTER TABLE ONLY p_items
    ADD CONSTRAINT p_items_pkey PRIMARY KEY (id);
ALTER TABLE ONLY stats
    ADD CONSTRAINT stats_pkey PRIMARY KEY (id);
ALTER TABLE ONLY p_orders
    ADD CONSTRAINT "$1" FOREIGN KEY (id_customer) REFERENCES customer(id) ON DELETE CASCADE;
ALTER TABLE ONLY p_items
    ADD CONSTRAINT "$1" FOREIGN KEY (id_order) REFERENCES p_orders(id) ON DELETE CASCADE;
ALTER TABLE ONLY h_orders
    ADD CONSTRAINT "$1" FOREIGN KEY (id_customer) REFERENCES customer(id) ON DELETE CASCADE;
ALTER TABLE ONLY h_items
    ADD CONSTRAINT "$1" FOREIGN KEY (id_order) REFERENCES h_orders(id) ON DELETE CASCADE;

Ответы [ 6 ]

4 голосов
/ 22 мая 2009

Вам, вероятно, следует создать представления для двух таблиц:

CREATE VIEW All_Orders
AS
     SELECT
          id,
          id_customer,
          code,
          date,
          'H' AS order_type
     FROM
          h_orders
     UNION ALL
     SELECT
          id,
          id_customer,
          code,
          date,
          'P' AS order_type
     FROM
          p_orders

CREATE VIEW All_Order_Items  -- A table name of "items" is pretty bad in my opinion
AS
     SELECT
          id,
          id_order,
          description,
          price,
          'H' AS order_item_type
     FROM
          h_items
     UNION ALL
     SELECT
          id,
          id_order,
          description,
          price,
          'P' AS order_item_type
     FROM
          p_items

Теперь вы можете просто присоединиться к этим представлениям. Я включил типы (P & H), чтобы вы знали, к чему теперь относится столбец «id». Если идентификаторы в ваших двух таблицах («h» и «p» могут иметь дубликаты, вам нужно будет присоединиться к таблице «Заказы» прямо в представлении All_Order_Items. В противном случае у вас будет много проблем при соединении между двумя представлениями. Надеемся, ваш идентификатор столбцы имеют интеллектуальный дизайн, а не просто столбцы с автоинкрементом или идентификацией.

2 голосов
/ 22 мая 2009

Вы можете попробовать это:

SELECT tbl.ID, 
       tbl.Name, 
       sum(tbl.num_orders) num_orders, 
       sum(tbl.total_money) total_money
FROM (    
      SELECT customer.id, 
             customer.name,        
             count(DISTINCT p_orders.id) AS num_orders,        
             sum(p_items.price) AS total_money    
      FROM customer        
            INNER JOIN p_orders 
                ON p_orders.id_customer = customer.id        
            INNER JOIN p_items 
                ON p_items.id_order = p_orders.id    
      GROUP BY customer.id, customer.name, p_orders.id_customer

      UNION

      SELECT customer.id, 
             customer.name,        
             count(DISTINCT h_orders.id) AS num_orders,
             sum(h_items.price) AS total_money    
      FROM  customer        
             INNER JOIN h_orders 
                 ON h_orders.id_customer = customer.id
             INNER JOIN h_items 
                 ON h_items.id_order = h_orders.id    
      GROUP BY customer.id, customer.name, h_orders.id_customer
    ) tbl
 GROUB BY tbl.id, tbl.name
 ORDER BY tbl.id ASC
1 голос
/ 22 мая 2009

Создать представление с объединением двух запросов, но без агрегатных функций. USE Union All, поскольку одна и та же запись отсутствует в обеих таблицах, и вам не нужно, чтобы сервер тратил время на то, чтобы убедиться в этом. Вы, вероятно, в другой раз захотите получить доступ к обеим таблицам в запросе.

Затем напишите ваш запрос, используя представление.

код представления будет выглядеть примерно так (вы можете использовать и другие поля для других целей:

Create view customerOrders
AS
SELECT      customer.id as CustomerID,  customer.name, p_orders.id as OrderID,  p_items.price  as price
FROM        customer        
INNER JOIN  p_orders ON p_orders.id_customer = customer.id        
INNER JOIN  p_items ON p_items.id_order = p_orders.id
union all
SELECT      customer.id,  customer.name,  h_orders.id as id, H_items.price           
FROM        customer        
INNER JOIN  h_orders ON h_orders.id_customer = customer.id        
INNER JOIN  h_items ON h_items.id_order = h_orders.id

тогда вызов для вашего запроса будет выглядеть примерно так (ничего из этого не проверено, возможно, потребуется корректировка)

SELECT    CustomerID,    customer.name,    count(DISTINCT OrderID) AS num_orders,    
sum(price) AS total_money
FROM    customerOrders
GROUP BY     CustomerID,    customer.name
ORDER BY    CustomerID
0 голосов
/ 22 мая 2009

Спасибо за все ответы, ребята ..

И «путь представления», и «путь подзапроса» Джимми Р. Хаутса работают отлично, может быть, представления более удобны в использовании ... и оба они должны занимать одинаковое время (или нет?)

Так что я отмечу как лучший ответ первым о взглядах.

В любом случае, если я могу, могу ли я спросить вас, являются ли структура и индексы, которые я использовал, хорошими или могут быть оптимизированы?

0 голосов
/ 22 мая 2009

Самый простой способ сделать то, на что вы смотрите, это создать представления (скажем, "a_orders" и "a_items"). Представления будут просто определены как:

SELECT * FROM p_orders
UNION
SELECT * FROM h_orders

Если вы удаляете строки из a_orders, когда вставляете их в h_orders (чтобы данный порядок не был в обеих таблицах), было бы немного эффективнее использовать UNION ALL вместо UNION.

0 голосов
/ 22 мая 2009

Насколько я знаю, SQL Server должен автоматически удалять дубликаты. Использование UNION ALL будет включать дубликаты. Я полагаю, что SQL Server будет использовать первичные ключи как средство для определения того, что является дубликатом. Первичные ключи в этих таблицах состоят из одного и того же типа данных, и ID 1 в вашей таблице p также ID 1 в вашей таблице h?

...