Question

CREATE TABLE `names` ( `name` varchar(20) );

Предположим, что таблица names содержит все 40 миллионов имен всех жителей Калифорнии (например).

SELECT count(*) as count, name FROM names GROUP BY name ORDER BY name;

Как мне оптимизировать этот запрос?

Ожидаемый результат:

count | name
 9999 | joe
 9995 | mike
 9990 | kate
 .... | ....
    2 | kal-el

Erich Kitzmueller · Answer 1 · 21 января 2010

Вы должны создать индекс по столбцу имени вашей таблицы. Запрос настолько хорош, насколько это возможно.

Jon Skeet · Answer 2 · 21 января 2010

Ну, с чего вы взяли, что он еще не оптимизирован? Это похоже на запрос, который хороший обработчик базы данных должен обрабатывать относительно легко, особенно если у вас есть соответствующий индекс в вашей таблице.

У вас действительно есть узкое место здесь, или вы беспокоитесь о том, что может произойти в будущем? Если это последнее, я предлагаю вам попробовать это с вашей RDBMS (путем создания фиктивных данных), и посмотреть, что произойдет.

Подсчет различных значений в большом наборе данных (40M строк): SELECT count (*) в качестве count, name FROM names GROUP BY name ORDER BY name;

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Подсчет различных значений в большом наборе данных (40M строк): SELECT count (*) в качестве count, name FROM names GROUP BY name ORDER BY name;

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов