SQL Server разделить один столбец несколько раз - PullRequest
6 голосов
/ 22 июня 2011

У меня есть таблица базы данных, в которой есть столбец со сложенными данными с двумя уровнями и столбцом, в котором я хочу разбить деталь. Вот пример данных (данные изменены, чтобы защитить невинных :):

Таблица

ID = varchar(100)
CarData = varchar(1000)

ID       CarData
1        Nissan:blue:20000,Ford:green:10000
2        Nissan:steel:20001,Ford:blue:10001,Chevy:blue:10000,Ford:olive:10000
** Note that cardata can is not fixed, and can have many cars in it

Требуемый выход:

ID   Manufacture    Color     Cost
1    Nissan         Blue      20000
1    Ford           green     10000
2    Nissan         steel      20001
... and on

Итак, чтобы сказать это прямо, мне нужно разбить первое сложенное поле, которое является запятой, и создать для этого строку, а затем разбить второе сложенное поле, которое является двоеточием, на столбцы.

Любая помощь будет принята с благодарностью.

Ответы [ 3 ]

6 голосов
/ 22 июня 2011
-- Sample data
declare @T table(ID int, CarData varchar(100))
insert into @T values 
(1,        'Nissan:blue:20000,Ford:green:10000'),
(2,        'Nissan:steel:20001,Ford:blue:10001,Chevy:blue:10000,Ford:olive:10000')

-- Recursice CTE to get one row for each car
;with cte(ID, Car, CarData) as
(
  select ID,
         cast(substring(CarData+',', 1, charindex(',', CarData+',')-1) as varchar(100)),
         stuff(CarData, 1, charindex(',', CarData), '')+','
  from @T
  where len(CarData) > 0
  union all
  select ID,
         cast(substring(CarData, 1, charindex(',', CarData)-1) as varchar(100)),
         stuff(CarData, 1, charindex(',', CarData), '')
  from cte
  where len(CarData) > 0
)
-- Use parsename to split the car data
select ID,
       parsename(replace(Car, ':', '.'), 3) as Manufacture,
       parsename(replace(Car, ':', '.'), 2) as Color,
       parsename(replace(Car, ':', '.'), 1) as Cost
from cte
order by ID

Результат:

ID  Manufacture  Color   Cost
--  -----------  ------   -----
1   Nissan       blue    20000
1   Ford         green   10000
2   Nissan       steel   20001
2   Ford         blue    10001
2   Chevy        blue    10000
2   Ford         olive   10000

Редактировать 1

У вас будут проблемы с parsename, если цвет, стоимость или название производителя содержат .. Если это так, попробуйте вместо этого.

-- Sample data
declare @T table(ID int, CarData varchar(100))
insert into @T values 
(1,        'Nissan:blue:20000,Ford:green:10000'),
(2,        'Nissan:steel:20001,Ford:blue:10001,Chevy:blue:10000,Ford:olive:10000')

-- Recursice CTE to get one row for each car
;with cte(ID, Car, CarData) as
(
  select ID,
         cast(substring(CarData+',', 1, charindex(',', CarData+',')-1) as varchar(100)),
         stuff(CarData, 1, charindex(',', CarData), '')+','
  from @T
  where len(CarData) > 0
  union all
  select ID,
         cast(substring(CarData, 1, charindex(',', CarData)-1) as varchar(100)),
         stuff(CarData, 1, charindex(',', CarData), '')
  from cte
  where len(CarData) > 0
)
-- Split the car data with substring
select ID,
       substring(Car, 1, P1.Pos-1) as Manufacture,
       substring(Car, P1.Pos+1, P2.Pos-P1.Pos-1) as Color,
       substring(Car, P2.Pos+1, len(Car)-P2.Pos) as Cost
from cte
  cross apply (select charindex(':', Car)) as P1(Pos)
  cross apply (select charindex(':', Car, P1.Pos+1)) as P2(Pos)
order by ID
1 голос
/ 22 июня 2011

Это должно решить вашу проблему:

[EDIT] Ваш идентификатор является varchar (100), и вы не указываете, является ли он первичным ключом, поэтому я внес некоторые изменения ... Идентификатор не должен быть первичным ключом в это дело.

declare @T table(ID varchar(100), CarData varchar(1000))
declare @OUT table(pk INT IDENTITY(1,1), ID varchar(100), Manufacture varchar(100), Color VARCHAR(100), Cost INT)
insert into @T (ID, CarData) values 
('1', 'Nissan:blue:20000,Ford:green:10000'),
('2', 'Nissan:steel:20001,Ford:blue:10001,Chevy:blue:10000,Ford:olive:10000')

DECLARE @x XML, @i INT, @ID VARCHAR(100), @maxi INT; 
;WITH list AS (SELECT pk = ROW_NUMBER() OVER(ORDER BY ID), * FROM @T)
  SELECT @i=1, @maxi=MAX(pk) FROM list;
WHILE @i <= @maxi
BEGIN
  ;WITH list AS (SELECT pk = ROW_NUMBER() OVER(ORDER BY ID), * FROM @T)
    SELECT
       @x = CAST( '<root><car><prop>' + 
                  REPLACE(
                    REPLACE(
                       CarData
                      ,':'
                      ,'</prop><prop>'
                    )
                    ,','
                    ,'</prop></car><car><prop>'
                  ) + 
                  '</prop></car></root>'
             AS XML)
     , @ID = ID 
    FROM list 
    WHERE pk = @i

  INSERT INTO @OUT 
    SELECT 
       ID = @ID
      ,Manufacture = x.value('./prop[1]','VARCHAR(100)')
      ,Color   = x.value('./prop[2]','VARCHAR(100)')
      ,Cost    = x.value('./prop[3]','INT')
    FROM @x.nodes('/root/car') AS T(x)

  SET @i = @i + 1;
END

SELECT * FROM @OUT

/* -- OUTPUT
ID  Manufacture   Color   Cost
--------------------------------
1   Nissan        blue    20000
1   Ford          green   10000
2   Nissan        steel   20001
2   Ford          blue    10001
2   Chevy         blue    10000
2   Ford          olive   10000
*/
1 голос
/ 22 июня 2011

Используйте эту функцию разделения строк , чтобы создать таблицу результатов.

Я бы сначала позвонил dbo.split(), используя , в качестве символа-разделителя. Тогда у вас будет список предметов, таких как:

Nissan:blue:20000
Ford:green:10000
Nissan:steel:20001
Ford:blue:10001
Chevy:blue:10000
Ford:olive:10000

Оттуда вы можете снова вызвать dbo.split(), используя : в качестве разделителя. Каждый вызов приведет к ровно трем записям (при условии, что ваш дизайн как минимум «нормальный»).

Как отметил @JNK в своем комментарии, надеюсь, это не то, что вы хотели бы регулярно запускать.

EDIT:

Пример кода для начала работы:

SELECT *
INTO #YuckyCar
FROM (
  SELECT 1 ID, 'Nissan:blue:20000,Ford:green:10000' CarData
  UNION
  SELECT 2, 'Nissan:steel:20001,Ford:blue:10001,Chevy:blue:10000,Ford:olive:10000'
) T;

-- Shows logical step #1
SELECT ID, X.items MoreCarData
FROM #YuckyCar CROSS APPLY dbo.Split(CarData, ',') X;

-- Shows logical step #2
SELECT Q.ID, Y.items
FROM (
  SELECT ID, X.items MoreCarData
  FROM #YuckyCar CROSS APPLY dbo.Split(CarData, ',') X) Q CROSS APPLY dbo.Split(Q.MoreCarData, ':') Y

DROP TABLE #YuckyCar;

Проблема в последней части заключается в том, что вы не можете гарантировать строку 1 = Производитель, строка 2 = Цвет, строка 3 = Стоимость.

...