Группировать агрегированные данные лучше в SQL или в CODE (с точки зрения производительности) - PullRequest
0 голосов
/ 11 ноября 2009

Я хотел бы спросить мнение о создании агрегированных данных путем объединения строк. Если у меня есть агрегат столбцов, но я хочу объединить их тогда в столбец агрегатов, что быстрее с точки зрения производительности? Выполнение одного SQL, затем просто агрегирование, затем в CODE. Или выбрав основные данные и запросив их по одному.

Например:

TABLE_A        
COL_A_1         COL_A_2
A               a
B               b
C               c

TABLE_B
COL_B_1         COL_B_2
a               Text1
a               Text2
a               Text3
b               Text4
b               Text5

Таблица объединяется в COL_A_2 = COL_B_1, агрегированный столбец - COL_B_2.

Вариант 1 (Выполнение одного SQL)

SELECT TABLE_1.COL_A_1, TABLE_1.COL_A_2, TABLE_2.COL_B_2 
FROM TABLE_A 
LEFT OUTER JOIN TABLE_B ON TABLE_A.COL_A_2 = TABLE_2.COL_B_1
ORDER BY TABLE_1.COL_A_1

Затем в коде просто зациклите набор результатов и агрегируйте COL_B_1. (например, с использованием Java)

String oldColA1 = "";
InfoEntity currInfo = null;
for (InfoEntity info : infoList) {
  if (!oldColA1.equals(info.colA1)) {
    currInfo = info;
  }

  if (currInfo.colB2 == null || currInfo.colB2.equals("")) {
    currInfo.colB2 = info.colB2;
  } else {
    currInfo.colB2 += info.colB2;
  }
  oldColA1 = info.colA1;
}

Вариант 2 (Выполнение нескольких SQL)

SELECT TABLE_1.COL_A_1, TABLE_1.COL_A_2
FROM TABLE_A 
ORDER BY TABLE_1.COL_A_1

Затем выберите для каждого в коде (Ex Java)

for (InfoEntity info : infoList) {
  // Select TableB entity based on info.colA2
  ...
  tableBList = dao.selectTableB(info.colA2);
  ...
  for (TableBEntity b : tableBList) {
    info.colB2 += b.colB2;
  }
}

Обычно я делаю вариант 1, потому что я думаю, что выбор нескольких SQL может быть дорогостоящим. Но я не уверен в этом. Но есть ли другой способ сделать этот тип агрегации. Я уже ищу в сети, и в стандартном SQL нет агрегации конкатенации строк. Кроме того, иллюстрация в Таблице A упрощена, обычно TableA представляет собой сложный запрос нескольких таблиц, объединенных вместе, как и TableB.

1 Ответ

3 голосов
/ 11 ноября 2009

Обычно я делаю вариант 1, потому что я думаю, что выбор из нескольких SQL стоит дорого.

Вы правы - поездок в базу данных должно быть как можно меньше.

Возможно групповое объединение - MySQL имеет GROUP_CONCAT , начиная с 4.1. С SQL Server вы можете использовать:

SELECT @out = COALESCE(@out + ',' + t.column, t.column)
  FROM TABLE t

Проверьте эту ссылку для примера, который должен работать в Oracle 9i +.

...