Как найти повторяющиеся значения в таблице в Oracle? - PullRequest
254 голосов
/ 12 сентября 2008

Какой самый простой оператор SQL, который будет возвращать повторяющиеся значения для данного столбца и количество их вхождений в таблицу базы данных Oracle?

Например: у меня есть таблица JOBS со столбцом JOB_NUMBER. Как я могу узнать, есть ли у меня дубликаты JOB_NUMBER с и сколько раз они дублируются?

Ответы [ 13 ]

560 голосов
/ 12 сентября 2008
SELECT column_name, COUNT(column_name)
FROM table_name
GROUP BY column_name
HAVING COUNT(column_name) > 1;
54 голосов
/ 13 сентября 2008

Другой способ:

SELECT *
FROM TABLE A
WHERE EXISTS (
  SELECT 1 FROM TABLE
  WHERE COLUMN_NAME = A.COLUMN_NAME
  AND ROWID < A.ROWID
)

Работает нормально (достаточно быстро), когда есть индекс на column_name. И это лучший способ удалить или обновить дублирующиеся строки.

31 голосов
/ 12 сентября 2008

Самое простое, что я могу придумать:

select job_number, count(*)
from jobs
group by job_number
having count(*) > 1;
16 голосов
/ 13 сентября 2008

Вам не нужно даже указывать количество в возвращаемых столбцах, если вам не нужно знать фактическое количество дубликатов например,

SELECT column_name
FROM table
GROUP BY column_name
HAVING COUNT(*) > 1
7 голосов
/ 12 сентября 2008

Как насчет:

SELECT <column>, count(*)
FROM <table>
GROUP BY <column> HAVING COUNT(*) > 1;

Чтобы ответить на пример выше, это будет выглядеть так:

SELECT job_number, count(*)
FROM jobs
GROUP BY job_number HAVING COUNT(*) > 1;
5 голосов
/ 20 сентября 2012

В случае, когда несколько столбцов идентифицируют уникальную строку (например, таблицу отношений), вы можете использовать следующее

Использовать идентификатор строки например emp_dept (empid, deptid, startdate, enddate) предположим, что empid и deptid уникальны и определяют строку в этом случае

select oed.empid, count(oed.empid) 
from emp_dept oed 
where exists ( select * 
               from  emp_dept ied 
                where oed.rowid <> ied.rowid and 
                       ied.empid = oed.empid and 
                      ied.deptid = oed.deptid )  
        group by oed.empid having count(oed.empid) > 1 order by count(oed.empid);

и если в такой таблице есть первичный ключ, используйте первичный ключ вместо rowid, например, id это pk, тогда

select oed.empid, count(oed.empid) 
from emp_dept oed 
where exists ( select * 
               from  emp_dept ied 
                where oed.id <> ied.id and 
                       ied.empid = oed.empid and 
                      ied.deptid = oed.deptid )  
        group by oed.empid having count(oed.empid) > 1 order by count(oed.empid);
4 голосов
/ 05 апреля 2013
SELECT   SocialSecurity_Number, Count(*) no_of_rows
FROM     SocialSecurity 
GROUP BY SocialSecurity_Number
HAVING   Count(*) > 1
Order by Count(*) desc 
4 голосов
/ 12 сентября 2008

Doing

select count(j1.job_number), j1.job_number, j1.id, j2.id
from   jobs j1 join jobs j2 on (j1.job_numer = j2.job_number)
where  j1.id != j2.id
group by j1.job_number

даст вам идентификаторы дублированных строк.

1 голос
/ 23 июля 2018

Я знаю, что это старая тема, но это может помочь кому-то.

Если вам нужно распечатать другие столбцы таблицы при проверке на наличие дубликатов ниже:

select * from table where column_name in
(select ing.column_name from table ing group by ing.column_name having count(*) > 1)
order by column_name desc;

также может добавить некоторые дополнительные фильтры в предложении where при необходимости.

1 голос
/ 12 января 2018

Вот запрос SQL для этого:

select column_name, count(1)
from table
group by column_name
having count (column_name) > 1;
...