Запрашивает большой набор данных для статистики в SQL Server? - PullRequest
1 голос
/ 23 сентября 2011

Скажем, у меня есть пример, для которого 5 миллионов объектов данных хранятся в виде строк в SQL Server.Если мне нужно выполнить некоторые статистические данные для данных, было бы лучше иметь таблицу для каждого образца или одну гигантскую таблицу, в которой я выбрал бы по идентификатору образца и затем запустил статистику?сотни или даже тысячи сэмплов, которые выглядят как одна огромная таблица.

Но я не эксперт по SQL Server, поэтому не могу сказать, будет ли один быстрее другого ...

Или, может быть, лучший способ справиться с таким большим набором данных?Я надеялся использовать SQL CLR с C # для выполнения своей тяжелой работы ...

1 Ответ

1 голос
/ 23 сентября 2011

Если вам нужно иметь дело с таким большим набором данных, мое внутреннее чувство говорит мне, что T-SQL и работа в наборах будут значительно быстрее , чем все, что вы можете сделать в SQL-CLR и RBAR (строка Подход "by-agonizing-row" ... работа с большими наборами данных, подведение итогов и выбор, для этого всегда был создан T-SQL и в чем он хорош.

5 миллионов строк - это не очень большое количество данных - это набор данных хорошего размера. Но если у вас есть соответствующие индексы, например, со столбцами, которые вы используете в ваших JOIN условиях, в вашем предложении WHERE и вашем предложении ORDER BY, все будет в порядке.

Если вам нужен все более подробный совет - попробуйте опубликовать структуру вашей таблицы, объясните, как вы будете запрашивать эту таблицу (какие критерии вы используете для WHERE и ORDER BY), и мы сможем предоставить еще несколько отзывов .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...