выбрав отличную комбинацию из 2 столбцов в SQL - PullRequest
2 голосов
/ 06 марта 2011

Когда я запускаю выборку после нескольких объединений в моей таблице, у меня выводится 2 столбца, и я хочу выбрать отличную комбинацию col1 и col2 для возвращенного набора строк.

запрос, который я запускаю, будет выглядеть примерно так:

select a.Col1,b.Col2 from a inner join b on b.Col4=a.Col3

теперь вывод будет выглядеть примерно так

Col1 Col2  
1   z  
2   z  
2   x  
2   y  
3   x  
3   x  
3   y  
4   a  
4   b  
5   b  
5   b  
6   c  
6   c  
6   d  

Теперь я хочу, чтобы вывод был примерно таким:

1  z  
2  y  
3  x  
4  a  
5  b  
6  d 

Это нормально, если я выберу второй столбец случайным образом, так как вывод моего запроса равен миллиону строк, и я действительно не думаю, что будет случай, когда я получу выходные данные Col1 и Col2 одинаковыми, даже если это так отредактируйте значение ..

Можете ли вы помочь мне с тем же ... Я думаю, что в основном col3 должен быть номером строки, я думаю, а затем мне нужно выбрать две базы cols по случайному номеру строки .. Я не знаю, как мне это перевести на SQL

рассмотрим случай 1a 1b 1c 1d 1e 2a 2b 2c 2d 2e, теперь группа по выдаст мне все эти результаты, где, как я хочу, 1a и 2d или 1a и 2b. любая такая комбинация.

Хорошо, позвольте мне объяснить, что я ожидал:

with rs as(
select a.Col1,b.Col2,rownumber() as rowNumber from a inner join b on b.Col4=a.Col3)
select rs.Col1,rs.Col2 from rs where rs.rowNumber=Round( Rand() *100)

теперь я не уверен, как мне правильно получить число или случайное число !!

Заранее спасибо.

Ответы [ 4 ]

6 голосов
/ 06 марта 2011

Если вам просто все равно, какое col2 значение возвращается

select a.Col1,MAX(b.Col2) AS Col2
from a inner join b on b.Col4=a.Col3 
GROUP BY a.Col1

Если вы хотите получить случайное значение, вы можете использовать следующий подход.

 ;WITH T
     AS (SELECT a.Col1,
                b.Col2
                ROW_NUMBER() OVER (PARTITION BY a.Col1 ORDER BY (SELECT NEWID())
                ) AS RN
         FROM   a
                INNER JOIN b
                  ON b.Col4 = a.Col3)
SELECT Col1,
       Col2
FROM   T
WHERE  RN = 1  

Илив качестве альтернативы используйте функцию агрегирования CLR.Преимущество этого подхода состоит в том, что он устраняет необходимость сортировки по partition, newid(), пример реализации приведен ниже.

using System;
using System.Data.SqlTypes;
using System.IO;
using System.Security.Cryptography;
using Microsoft.SqlServer.Server;

[Serializable]
[SqlUserDefinedAggregate(Format.UserDefined, MaxByteSize = 8000)]
public struct Random : IBinarySerialize
{
    private MaxSoFar _maxSoFar;

    public void Init()
    {
    }

    public void Accumulate(SqlString value)
    {
        int rnd = GetRandom();
        if (!_maxSoFar.Initialised || (rnd > _maxSoFar.Rand))
            _maxSoFar = new MaxSoFar(value, rnd) {Rand = rnd, Value = value};
    }

    public void Merge(Random group)
    {
        if (_maxSoFar.Rand > group._maxSoFar.Rand)
        {
            _maxSoFar = group._maxSoFar;
        }
    }

    private static int GetRandom()
    {
        var buffer = new byte[4];

        new RNGCryptoServiceProvider().GetBytes(buffer);
        return BitConverter.ToInt32(buffer, 0);
    }

    public SqlString Terminate()
    {
        return _maxSoFar.Value;
    }

    #region Nested type: MaxSoFar

    private struct MaxSoFar
    {
        private SqlString _value;

        public MaxSoFar(SqlString value, int rand) : this()
        {
            Value = value;
            Rand = rand;
            Initialised = true;
        }

        public SqlString Value
        {
            get { return _value; }
            set
            {
                _value = value;
                IsNull = value.IsNull;
            }
        }

        public int Rand { get; set; }

        public bool Initialised { get; set; }
        public bool IsNull { get; set; }
    }

    #endregion


    #region IBinarySerialize Members

    public void Read(BinaryReader r)
    {
        _maxSoFar.Rand = r.ReadInt32();
        _maxSoFar.Initialised = r.ReadBoolean();
        _maxSoFar.IsNull = r.ReadBoolean();

        if (_maxSoFar.Initialised && !_maxSoFar.IsNull)
            _maxSoFar.Value = r.ReadString();
    }

    public void Write(BinaryWriter w)
    {
        w.Write(_maxSoFar.Rand);
        w.Write(_maxSoFar.Initialised);
        w.Write(_maxSoFar.IsNull);

        if (!_maxSoFar.IsNull)
            w.Write(_maxSoFar.Value.Value);
    }

    #endregion
}
3 голосов
/ 06 марта 2011

Вам нужно сгруппировать по a.Col1, чтобы различить только по a.Col1, тогда, поскольку b.Col2 не входит в группу, вам нужно найти подходящую функцию агрегирования, чтобы уменьшить все значения в группе до одного, MIN достаточно, если вам нужно только одно из значений.

select a.Col1, MIN(b.Col2) as c2
from a 
inner join b on b.Col4=a.Col3
group by a.Col1
0 голосов
/ 06 марта 2011

Если я вас правильно понимаю, вы хотите иметь одну строку для каждой комбинации в столбцах 1 и 2. Это можно легко сделать, используя GROUP BY или DISTINCT, например:

SELECT col1, col2

ОТ ВАШЕГО Присоединения

ГРУППА ПО col1, col2

0 голосов
/ 06 марта 2011

Вы должны использовать предложение group by:

select a.Col1,b.Col2 
from a 
inner join b on b.Col4=a.Col3
group by a.Col1
...