GROUP_CONCAT с дополнительной группировкой? - PullRequest
3 голосов
/ 28 апреля 2011

Я запустил скрипт для генерации статистики того, как часто и когда вызывается конкретная статья, используя

SELECT `title`, `page_id`, COUNT(*) AS `total`, 
GROUP_CONCAT(DISTINCT `date_created` 
             ORDER BY `date_created` SEPARATOR ',') dates 
FROM `statistics` 
WHERE `supplier_id` = '27' 
GROUP BY `title` 
ORDER BY `title`;

, который производит

[0] => Array
        (
            [0] => Array
                (
                    [total] => 3
                    [dates] => 2011-04-26,2011-04-27
                )

            [statistics] => Array
                (
                    [title] => Title 2
                    [page_id] => 2
                )  
        )

[1] => Array
        (
            [0] => Array
                (
                    [total] => 6
                    [dates] => 2011-04-26,2011-04-27,2011-04-28
                )

            [statistics] => Array
                (
                    [title] => Title 7
                    [page_id] => 7
                )
        )

Хорошие вещи. Но как я могу добавить поле, похожее на даты, которое добавляет разбивку идентификаторов, сгруппированных по дате создания, создавая что-то вроде:

[2] => Array
    (
        [0] => Array
            (
                [total] => 6
                [dates] => 2011-04-26,2011-04-27,2011-04-28
                [total_by_date] => 2,1,3
            )

        [statistics] => Array
            (
                [title] => Title 7
                [page_id] => 7
            )
)

Я хотел бы добавить дополнительную группу GROUP BY в следующих строках:

GROUP_CONCAT(DISTINCT COUNT(*) AS `total_by_date` 
             GROUP BY `date_created` ORDER BY `date_created` SEPARATOR ',')

но это не работает, как это исправить?

DUMP:

CREATE TABLE `statistics` (
  `id` int(11) NOT NULL auto_increment,
  `pagetype` varchar(50) character set utf8 collate utf8_unicode_ci NOT NULL,
  `supplier_id` int(11) NOT NULL,
  `page_id` int(11) default NULL,
  `title` varchar(255) character set utf8 collate utf8_unicode_ci NOT NULL,
  `date_created` date NOT NULL,
  PRIMARY KEY  (`id`)
) ENGINE=MyISAM  DEFAULT CHARSET=latin1 AUTO_INCREMENT=920 ;

-- 
-- Dumping data for table `statistics`
-- 

INSERT INTO `statistics` (`id`, `pagetype`, `supplier_id`, `page_id`, `title`, `date_created`) VALUES 
(1, 'newsarticle', 27, 2751, 'Title 1', '2011-04-26'),
(2, 'newsarticle', 27, 2751, 'Title 1', '2011-04-26'),
(3, 'newsarticle', 27, 2751, 'Title 1', '2011-04-27'),
(4, 'newsarticle', 27, 462009, 'Title 2', '2011-04-26'),
(5, 'newsarticle', 27, 462009, 'Title 2', '2011-04-26'),
(6, 'newsarticle', 27, 462009, 'Title 2', '2011-04-27'),
(7, 'newsarticle', 27, 462009, 'Title 2', '2011-04-27'),
(8, 'newsarticle', 27, 462009, 'Title 2', '2011-04-27'),
(9, 'newsarticle', 27, 462009, 'Title 2', '2011-04-28'),
(10, 'newsarticle', 27, 46200, 'Title 3', '2011-04-26'),
(11, 'newsarticle', 27, 46200, 'Title 3', '2011-04-26'),
(12, 'newsarticle', 27, 46200, 'Title 3', '2011-04-26'),
(13, 'newsarticle', 27, 46200, 'Title 3', '2011-04-26'),
(14, 'newsarticle', 27, 46200, 'Title 3', '2011-04-26');

1 Ответ

1 голос
/ 28 апреля 2011

Не уверен на 100%, что это сработает, но это начало:

Выполните 2-й GROUP_CONCAT в подзапросе.

SELECT title
  , s1.page_id
  , s2.total_by_date
  , GROUP_CONCAT(DISTINCT s1.date_created
                 ORDER BY s1.date_created SEPARATOR ',') as dates  
FROM statistics s1
INNER JOIN  
  (SELECT page_id
     ,GROUP_CONCAT(/*DISTINCT*/ gc.cnt
     ORDER BY gc.date_created SEPARATOR ',') AS total_by_date
   FROM 
   (
      SELECT count(*) as cnt
        ,date_created
      FROM statistics
      WHERE supplier_id = '27'
      GROUP BY date_created
   ) gc
   GROUP BY gc.date_created
  ) s2 ON (s1.page_id = s2.page_id)      
WHERE supplier_id = '27'  
GROUP BY title  
ORDER BY title; 

Использование различного количества (*) скрыло бы элементы с таким же количеством, что, я думаю, вам не нужно, поэтому я добавил их в комментариях.
Кстати, ORDER BY title здесь не нужен, потому что GROUP BY уже сортирует по заголовку.

...