1 триллион +
одна запись будет содержать текстовые данные и метаданные о текстовом документе.
pl, помогите мне понять ограничения хранения
Надеюсь, у вас БОЛЬШОЙ бюджет на оборудование.Это большой размер, как в «миллионах».
Триллион документов при общем объеме хранения 1024 байта на один документ (ОЧЕНЬ маловероятно, когда вы произносите текст) имеет размер около 950 терабайт данных.Ограничения хранилища означают, что вы говорите о высоком конце SAN здесь.Использование не избыточной настройки дисков объемом 2 ТБ, что составляет 450 дисков.Сделать математику.Добавление избыточности / рейда к этому, и вы говорите о крупных аппаратных инвестициях.Это предполагает только 1 КБ на документ.Если вы используете в среднем 16 кг данных, это ... 7200 2 ТБ дисков.
Это аппаратная проблема для начала.SQL Server не так масштабируется, и вы все равно не сможете сделать это в одной системе.Обычный подход для хранилища документов, подобного этому, - это кластерная система хранения (кластерная или каким-либо образом распределенная файловая система) плюс центральная база данных для ключевых слов / тегов.В зависимости от загрузки / вставки, возможно, с заменами базы данных hte для распределенного поиска.
Что бы это ни было, требования к хранилищу / резервному копированию превосходны.Проект Лагре здесь, большой бюджет.
Нагрузка ввода-вывода должна быть другой проблемой - с точки зрения аппаратного обеспечения.Вам понадобится большая машина и вы получите тонну пропускной способности ввода-вывода.Я видел 8-гигабитные ссылки, перегруженные на SQL-сервере (питаемом HP eva с 190 дисками), и я могу представить, что вы запустите нечто подобное.Вам понадобится как можно больше аппаратных средств, насколько это технически возможно, независимо от цены, если только вы не храните капли снаружи.
Сжатие строк SQL может оказаться ОЧЕНЬ удобным.Полнотекстовый поиск будет проблемой.
общий объем данных будет превышать 1000 ТБ.
Нет.Шутки в сторону.Это будет больше, я думаю.1000 ТБ будет предполагать, что документы маленькие - как XML-форма проездного билета.