SQL-запрос для выбора дна 2 из каждой категории - PullRequest
6 голосов
/ 17 декабря 2009

В Mysql я хочу выбрать 2 нижних элемента из каждой категории

Category Value
1        1.3
1        4.8
1        3.7
1        1.6
2        9.5
2        9.9
2        9.2
2        10.3
3        4
3        8
3        16

Даешь мне:

Category Value
1        1.3
1        1.6
2        9.5
2        9.2
3        4
3        8

Перед тем, как перейти с sqlite3, мне сначала нужно было выбрать самый низкий уровень из каждой категории, а затем, исключив все, что к нему присоединилось, мне пришлось снова выбрать самый низкий уровень из каждой категории. Тогда все, что равняется этому новому наименьшему или меньшему в выигранной категории. Это также выбрало бы больше 2 в случае ничьей, что раздражало ... У него также было очень долгое время выполнения.

Моя конечная цель - подсчитать, сколько раз человек находится в одной из 2 самых низких категорий (есть также поле имени), и эту часть я не знаю, как сделать. Спасибо

Ответы [ 5 ]

8 голосов
/ 17 декабря 2009
SELECT c1.category, c1.value
FROM catvals c1
LEFT OUTER JOIN catvals c2
  ON (c1.category = c2.category AND c1.value > c2.value)
GROUP BY c1.category, c1.value
HAVING COUNT(*) < 2;

Проверено на MySQL 5.1.41 с вашими тестовыми данными. Выход:

+----------+-------+
| category | value |
+----------+-------+
|        1 |  1.30 |
|        1 |  1.60 |
|        2 |  9.20 |
|        2 |  9.50 |
|        3 |  4.00 |
|        3 |  8.00 |
+----------+-------+

(дополнительные десятичные разряды объясняются тем, что я объявил столбец value как NUMERIC(9,2).)

Как и другие решения, при наличии связей создается более 2 строк на категорию. Есть способы создать условие соединения, чтобы решить эту проблему, но нам нужно было бы использовать первичный ключ или уникальный ключ в вашей таблице, и мы также должны были бы знать, как вы намереваетесь разрешить связи .

4 голосов
/ 17 декабря 2009

Вы можете попробовать это:

SELECT * FROM (
  SELECT c.*,
        (SELECT COUNT(*)
         FROM user_category c2
         WHERE c2.category = c.category
         AND c2.value < c.value) cnt
  FROM user_category c ) uc
WHERE cnt < 2

Это должно дать вам желаемые результаты, но проверьте, в порядке ли производительность

1 голос
/ 17 декабря 2009

Вот решение, которое правильно обрабатывает дубликаты. Имя таблицы 'zzz', столбцы int и float

select
    smallest.category category, min(smallest.value) value
from 
    zzz smallest
group by smallest.category

union

select
    second_smallest.category category, min(second_smallest.value) value
from
    zzz second_smallest
where
    concat(second_smallest.category,'x',second_smallest.value)
    not in ( -- recreate the results from the first half of the union
        select concat(c.category,'x',min(c.value))
        from zzz c
        group by c.category
    )
group by second_smallest.category

order by category

Предостережения:

  • Если для данной категории есть только одно значение, то возвращается только эта единственная запись.
  • Если бы для каждой строки был уникальный идентификатор записи, вам не понадобилось бы все конкататы для имитации уникального ключа.

Ваш пробег может отличаться,

- Mark

1 голос
/ 17 декабря 2009

Вот очень обобщенное решение, которое будет работать для выбора первых n строк для каждой категории. Это будет работать, даже если в стоимости есть дубликаты.

/* creating temporary variables */
mysql> set @cnt = 0;
mysql> set @trk = 0;

/* query */
mysql> select Category, Value 
       from (select *, 
                @cnt:=if(@trk = Category, @cnt+1, 0) cnt, 
                @trk:=Category 
                from user_categories 
                order by Category, Value ) c1 
       where c1.cnt < 2;

Вот результат.

+----------+-------+
| Category | Value |
+----------+-------+
|        1 |   1.3 |
|        1 |   1.6 |
|        2 |   9.2 |
|        2 |   9.5 |
|        3 |     4 |
|        3 |     8 |
+----------+-------+

Это проверено на MySQL 5.0.88 Обратите внимание, что начальное значение переменной @trk должно быть не наименьшим значением поля Category.

1 голос
/ 17 декабря 2009

Союз должен работать. Я не уверен в производительности по сравнению с решением Питера.

SELECT smallest.category, MIN(smallest.value)
    FROM categories smallest
GROUP BY smallest.category
UNION
SELECT second_smallest.category, MIN(second_smallest.value)
    FROM categories second_smallest
    WHERE second_smallest.value  > (SELECT MIN(smallest.value) FROM categories smallest WHERE second.category = second_smallest.category)
GROUP BY second_smallest.category
...