SQL DISTINCT при объединении LEFT JOIN с подзапросом - PullRequest
0 голосов
/ 28 апреля 2011

У меня есть две таблицы SQL для хранения названий фильмов и даты, когда я их видел:

CREATE TABLE movies (
  id int(10) unsigned NOT NULL AUTO_INCREMENT,
  title varchar(90) NOT NULL,
  year varchar(7) DEFAULT NULL,
  watchAgain enum('0', '1') NOT NULL DEFAULT '0',
  PRIMARY KEY (id)
) ENGINE=MyISAM  DEFAULT CHARSET=utf8 AUTO_INCREMENT=3 ;

INSERT INTO movies (id, title, year, watchAgain) 
  VALUES (1, 'Wall Street', '1987', '1'), (2, 'Wag the Dog', '1997', '1');

CREATE TABLE movies_seen (
  object_id int(10) NOT NULL DEFAULT '0',
  date varchar(10) CHARACTER SET utf8 COLLATE utf8_unicode_ci 
    NOT NULL DEFAULT '0',
  seen_again enum('0', '1') NOT NULL DEFAULT '0',
  PRIMARY KEY (object_id, date)
) ENGINE=MyISAM DEFAULT CHARSET=utf8;

INSERT INTO `movies_seen` (object_id, date, seen_again)   
  VALUES (1, '1156187700', '0'), (1, '1218395700', '0'), (2, '0', '0');

Чтобы найти фильмы, которые мне нужно посмотреть снова, я запрашиваю в базе данных названия с seen_again == 1, или если seen_again == 0 и он не хранится в movies_seen:

SELECT m.year, m.title, s.date AS last_seen
FROM movies m 
LEFT JOIN movies_seen s ON m.id = s.object_id
WHERE 
     (
     m.watchAgain = '0'
     AND m.id NOT IN (SELECT s.object_id 
                      FROM movies m 
                      INNER JOIN movies_seen s ON m.id = s.object_id)
    OR m.watchAgain = '1'
    )
ORDER BY m.title

Это в основном работает, но когда в таблице movies_seen есть 2 записи для одного и того же заголовка, в результатах появляются дубликаты:

year    title           last_seen 
1997    Wag the Dog 0
1987    Wall Street 1156187700
1987    Wall Street 1218395700

Он работает с DISTINCT, если я получаю только заголовок, но, так как мне нужны дополнительные столбцы, это, очевидно, дает сбой.Идеи?

Ответы [ 2 ]

4 голосов
/ 28 апреля 2011

В MySQL предложение GROUP BY может выполнять ту же задачу, что и DISTINCT

SELECT m.year
  , m.title
  , s.date AS last_seen 
FROM movies m  
LEFT JOIN movies_seen s ON m.id = s.object_id 
WHERE (m.watchAgain = '0'             
  AND m.id NOT IN (SELECT s.object_id 
                   FROM movies m 
                   INNER JOIN movies_seen s ON m.id = s.object_id)             
  OR m.watchAgain = '1') 
GROUP BY m.title /*<<--- this will do a distinct on title only*/
ORDER BY m.title 

AFAIK, это работает только на MySQL.

Кстати: поскольку вы группируете m.title, MySQL выполняет сортировку по заголовку, поэтому предложение ORDER BY технически больше не требуется.

0 голосов
/ 28 апреля 2011
SELECT m.year, m.title, s.date AS last_seen
FROM movies m 
WHERE exists  
    ( 
      select 1 from movies_seen s 
          where m.id = s.object_id 
           and ( m.watchAgain = '0'
            AND m.id NOT IN (SELECT s.object_id FROM movies m INNER JOIN movies_seen s ON m.id = s.object_id)
            OR m.watchAgain = '1'
            )
    )
ORDER BY m.title
...