Question

Я работаю над проблемой в Oracle, которую я пытаюсь решить «элегантно».

У меня есть извлечение данных с тремя различными идентификаторами: A, B, C

Каждый идентификатор может появляться в более чем одной строке, и каждая строка может иметь один или несколько из этих трех идентификаторов (т. Е. Столбец заполнен или равен нулю).

Я хочу иметь возможность группировать все записи, в которых есть любая комбинация из A, B или C, и назначать им один и тот же идентификатор группы.

Извлечь таблицу, показывающую, что должны делать возможные группыbe:

Rownum | A    | B    | C    | End group
1        p      NULL   NULL   1
2        p      r      NULL   1
3        q      NULL   NULL   2
4        NULL   r      NULL   1
5        NULL   NULL   s      2
6        q      NULL   s      2

Мой оригинальный подход заключался в назначении guid для каждой строки в извлечении и создании таблицы поиска для трех идентификаторов:

GUID | IDENTIFIER | IDENTIFIER TYPE | GROUP | END GROUP
1      p            A                 1       1
2      p            A                 1       1
2      r            B                 2       1
3      q            A                 3       3
4      r            B                 2       1
5      s            C                 4       3
6      q            A                 3       3
6      s            C                 4       3

Затем группировка по идентификатору и назначениеномер группы.Группы, однако, должны быть объединены, где это возможно, чтобы обеспечить представление, показанное в конечной группе.

Единственное решение, которое я могу придумать для этой проблемы, - это использовать циклы, которых я бы предпочел избежать.

Любые идеи будут с благодарностью.

Найл

Vincent Malgrat · Answer 1 · 04 августа 2010

Это действительно интересная проблема. Тем не менее, я думаю, что нам не хватает определения «группы». Поскольку в вашем примере (p,null,null) (строка1) и (null,r,null) (строка4) не имеют общего идентификатора и принадлежат к одной группе, я воспользуюсь этим определением для группировки:

Строка принадлежит группе, если она имеет хотя бы один идентификатор хотя бы с одной строкой этой группы.

Это означает, что мы можем "цеплять" строки. Это естественно приводит к иерархическому решению:

SQL> SELECT ID, a, b, c, MIN(grp) grp
  2    FROM (SELECT connect_by_root(id) ID,
  3                 connect_by_root(a) a,
  4                 connect_by_root(b) b,
  5                 connect_by_root(c) c,
  6                 ID grp
  7             FROM a
  8           CONNECT BY NOCYCLE(PRIOR a = a
  9                           OR PRIOR b = b
 10                           OR PRIOR c = c))
 11   GROUP BY ID, a, b, c
 12   ORDER BY ID;

        ID A          B          C                 GRP
---------- ---------- ---------- ---------- ----------
         1 p                                         1
         2 p          r                              1
         3 q                                         3
         4            r                              1
         5                       s                   3
         6 q                     s                   3

6 rows selected

Вы можете выполнить подзапрос, чтобы понять конструкцию:

SQL> SELECT connect_by_root(id) ID,
  2         connect_by_root(a) a,
  3         connect_by_root(b) b,
  4         connect_by_root(c) c,
  5         substr(sys_connect_by_path(ID, '->'), 3) path,
  6         ID grp
  7    FROM a
  8  CONNECT BY NOCYCLE(a = PRIOR a
  9                  OR b = PRIOR b
 10                  OR c = PRIOR c);

        ID A          B          C          PATH            GRP
---------- ---------- ---------- ---------- -------- ----------
         1 p                                1                 1
         1 p                                1->2              2
         1 p                                1->2->4           4
         2 p          r                     2                 2
         2 p          r                     2->1              1
         2 p          r                     2->4              4
         3 q                                3                 3
         3 q                                3->6              6
         3 q                                3->6->5           5
         4            r                     4                 4
         4            r                     4->2              2
         4            r                     4->2->1           1
         5                       s          5                 5
         5                       s          5->6              6
         5                       s          5->6->3           3
         6 q                     s          6                 6
         6 q                     s          6->3              3
         6 q                     s          6->5              5

18 rows selected

Michael Pakhantsov · Answer 2 · 28 июля 2010

Использовать слияние вместо цикла:

Table a(a,b,c,groupId)

Заявление:

   merge into a
   USING (SELECT RANK() OVER(ORDER BY a,b,c) g, ROWID rid FROM a) SOURCE
   ON (a.ROWID = SOURCE.rid)
   WHEN MATCHED THEN UPDATE SET a.GroupId = SOURCE.g

Это так же, как:

    BEGIN
        FOR x IN ( SELECT RANK() OVER(ORDER BY a,b,c) g, ROWID rid FROM a)
        LOOP
             UPDATE a
                SET GroupId  = x.g
             WHERE a.RowId = x.rid;
        END LOOP;
    END;

SQL объединяет несколько идентификаторов для создания идентификатора группы для повторяющихся записей

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

SQL объединяет несколько идентификаторов для создания идентификатора группы для повторяющихся записей

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы