Объединение полей в разных строках - PullRequest
1 голос
/ 17 марта 2010

Я застрял в проблеме агрегации, до которой не дошёл.

У меня есть некоторые данные, которые лучше всего суммировать следующим образом

id |phraseId|seqNum|word
=========================
1  |1       |1     |hello
2  |1       |2     |world
3  |2       |1     |black
4  |2       |2     |and
5  |2       |3     |white

Я бы хотел запрос, который возвращает следующие данные:

phraseId|completePhrase
========================
1       |hello world
2       |black and white

Любой

EDIT

Я заметил, что все предоставленные решения используют FOR XML PATH. Что это за магия?

Ответы [ 4 ]

2 голосов
/ 17 марта 2010

попробуйте это:

DECLARE @TableA  table (RowID int, phraseId varchar(5),seqNum int, word varchar(5))

INSERT INTO @TableA VALUES (1,1,1,'hello')
INSERT INTO @TableA VALUES (2,1,2,'world')
INSERT INTO @TableA VALUES (3,2,1,'black')
INSERT INTO @TableA VALUES (4,2,2,'and')
INSERT INTO @TableA VALUES (5,2,3,'white')

SELECT
    c1.phraseId
        ,STUFF(
                 (SELECT
                      ' ' + word
                      FROM @TableA  c2
                      WHERE c2.phraseId=c1.phraseId
                      ORDER BY c1.phraseId, seqNum
                      FOR XML PATH('') 
                 )
                 ,1,1, ''
              ) AS CombinedValue
    FROM @TableA c1
    GROUP BY c1.phraseId
    ORDER BY c1.phraseId

ВЫВОД:

phraseId CombinedValue
-------- --------------------------
1        hello world
2        black and white

(2 row(s) affected)
2 голосов
/ 17 марта 2010

Одним из решений является создание UDF с использованием выражения FOR XML PATH .

  • UDF обрабатывает объединение одного PhraseID
  • может использоваться при обычном выборе

Оператор SQL

SELECT  PhraseID, dbo.UDF_ConcatWord(PhraseID)
FROM    Phrases
GROUP BY PhraseID

Создание UDF

CREATE FUNCTION dbo.UDF_ConcatWord(@phraseID INT) RETURNS VARCHAR(8000) AS
BEGIN  
  DECLARE @r VARCHAR(8000)
  SELECT @r = (
    SELECT  word + ', '
    FROM    Phrases
    WHERE   phraseID = @phraseID
    FOR XML PATH('')
  )
  IF LEN(@r) > 0 SET @r = SUBSTRING(@r, 1, LEN(@r)-1)
  RETURN @r
END
GO

редактировать

После самостоятельной проверки некоторых ссылок, еще более короткое решение -

Оператор SQL

SELECT  DISTINCT p1.PhraseID
        , STUFF(( SELECT  ' ' + p2.word 
                  FROM    Phrases AS p2 
                  WHERE   p2.PhraseID = p1.PhraseID 
                  FOR XML PATH('')), 1, 1, '') AS completePhrase
FROM      Phrases AS p1
ORDER BY  p1.PhraseID
1 голос
/ 17 марта 2010

Я немного обманул, предполагая, что у вас есть таблица, которая содержит запись заголовка для каждой фразы. Если это отсутствует, вы можете создать его, выбрав отдельный список фраз-идентификаторов из таблицы, содержащей слова:

declare @words table
(id int
,phraseId int
,seqNum int
,word varchar(10)
)

insert @words
select 1,1,1,'hello'
union select 2,1,2,'world'
union select 3,2,1,'black'
union select 4,2,2,'and'
union select 5,2,4,'white'

declare @phrase table
(phraseId int)

insert @phrase
select 1
union select 2

select phraseID
       ,phraseText AS completePhrase
FROM @phrase AS p
CROSS APPLY (select word + ' ' as [text()]
             from @words AS w
             where w.phraseID = p.phraseID
             for xml path('')
            ) as phrases (phraseText)
0 голосов
/ 18 марта 2010

В конце я использовал второй ответ Ливена, но обнаружил, что для некоторых комбинаций строк трюк FOR XML PATH('') вызывает проблемы:

declare @phrases table
(
    id int
    ,phraseId int
    ,seqNum int
    ,word varchar(10)
)

insert 
    @phrases 
values
    (1,1,1,'hello'),
    (2,1,2,'world'),
    (3,2,1,'black'),
    (4,2,2,'and'),
    (5,2,3,'white')

SELECT  
    DISTINCT p1.PhraseID, 
    STUFF(
        ( 
            SELECT  
                ' ' + p2.word 
            FROM    
                @phrases AS p2 
            WHERE   
                p2.PhraseID = p1.PhraseID 
            FOR XML PATH('')
        ), 1, 1, '') AS completePhrase
FROM      
    @phrases AS p1
ORDER BY  
    p1.PhraseID

работает нормально, но если в примере используются символы, которые должны были бы быть экранированы, если бы они использовались в XML, возникают проблемы. Например, через него проходят следующие данные:

insert 
    @words 
values
    (1,1,1,'hello>'), --notice the less than symbol
    (2,1,2,'world'),
    (3,2,1,'black')

Придает

hello> world

а также, если исходная таблица объявлена ​​не по порядку, требуется order by

Небольшой мод к исходному запросу исправляет все:

SELECT  
    DISTINCT p1.PhraseID, 
    STUFF(
        ( 
            SELECT  
                ' ' + p2.word 
            FROM    
                @words AS p2 
            WHERE   
                p2.PhraseID = p1.PhraseID 
            ORDER BY
                p2.seqNum  --required
            FOR XML PATH(''),TYPE
        ).value('.','nvarchar(4000)'), 
        1, 
        1, 
        ''
    ) AS completePhrase
FROM      
    @words AS p1
ORDER BY  
    p1.PhraseID

(см. ДЛЯ ПУТИ XML (''): экранирование "специальных" символов )

...