MOSS 2007 как большое хранилище документов PDF - PullRequest
2 голосов
/ 03 мая 2011

На самом деле я пытаюсь изучить возможность создания хранилища документов PDF на основе MOSS2007.Нет рабочего процесса, только огромное количество документов и доступ к библиотекам документов (также доступны для поиска).

Вопрос заключается в возможности создания такого решения, предполагая, что: - PDF-документы могут быть до миллиона (!) За один разброшенный в библиотеки документов и предоставленный в Интернете снаружи;

Ферма - это то, что предлагается: - 1x Front Web Server - 2x Index Server - 1x Query Server - 1x MS SQL Server - 2x 12TB Storage

Можно ли обеспечить разумную производительность при таком огромном количестве файлов?Кто-нибудь имел дело со строительством аналогичного типа решений цифровой библиотеки?

Ответы [ 4 ]

2 голосов
/ 03 мая 2011

Вы столкнетесь с проблемами производительности, если вы поместите более 2000 элементов в один список. Одна стратегия, чтобы обойти эту проблему, состоит в том, чтобы использовать папки как корзины с ограничением 2000 элементов в каждой.

Было бы также целесообразно рассмотреть возможность разделения на несколько семейств сайтов, чтобы все эти документы не находились в одной базе данных SQL.

Обновление и консолидация:

Как указывает Бенджамин Дж. Атавес , определение размера контента также является важным фактором для рассмотрения. Подробности смотрите в его ответе.

nRouteNPingMe предлагает рассмотреть вариант решения 2010 года, поскольку этот вопрос был рассмотрен в более новой версии. Если вы не привязаны к 2007 году, я бы рассмотрел этот маршрут.

1 голос
/ 04 мая 2011

То, что я до сих пор не упоминал, - это размер файла.

Предполагая, что размер каждого PDF-файла составляет в среднем 1 МБ, вы столкнетесь с ограничениями размера базы данных контента до того, как вышеупомянутые ограничения в отношении # items / scope.

Планирование емкости - это компромисс - если вы хотите хранить 1 миллион документов, вам нужно подумать о разделении файлов на несколько баз данных контента - и, следовательно, на несколько семейств сайтов.

Несмотря на то, что в некоторых случаях Microsoft поддерживает до 1 ТБ контента на базу данных в SharePoint 2010 (для статических репозиториев), я не знаю аналогичного сценария поддержки для SharePoint 2007.

Что касается FileStream (я полагаю, что вы имеете в виду RBS здесь), я бы не рекомендовал его в производственном сценарии без очень тщательного рассмотрения. Я бы рассматривал это в первую очередь как средство экономии затрат и учту, что это может значительно усложнить вашу стратегию резервного копирования и аварийного восстановления.

Надеюсь, это поможет.

1 голос
/ 03 мая 2011

Крис ответил не совсем правильно. Вы можете иметь более 2000 элементов в списке, если они не все отображаются в одном представлении.

В библиотеке документов (где вы будете хранить ваши документы PDF) вы можете иметь до 5 миллионов элементов. Пока вы найдете структуру папок / views, которые работают с ограничением <2000 items / view. </p>

Итак, вопрос в том, можете ли вы разделить ваши документы так, чтобы это имело смысл для вас? Если это так, я не буду беспокоиться о масштабируемости.

Все цифры, которые я здесь упоминаю, взяты из этой статьи .

.

Версия TL; DR: http://www.sharepointkings.com/2009/01/limitation-and-upper-boundaries-of_28.html

0 голосов
/ 05 мая 2011

Здесь происходит пара вещей, и никто не может ответить на все ваши вопросы с фактами, которые вы нам дали.

Прежде всего, количество документов, которые вы предлагаете, может обрабатываться одной библиотекой документов (или несколькими библиотеками документов), если вы следуете приведенным выше советам относительно хранения элементов в папках. Это очень важно.

Что мы не можем сказать вам, если у вас достаточно оборудования. Конечно, довольно легко узнать, достаточно ли у вас хранилища, но получение необходимого количества оборудования SP зависит от ваших вариантов использования и других факторов:

  • Сколько пользователей?
  • Насколько одновременно?
  • Как часто данные меняются?
  • Имеют ли предметы уникальные требования безопасности?
  • Какие поиски вы будете выполнять по данным?
  • и так далее ...

Наконец, вы упомянули, что вам нужно 2 сервера индексирования для MOSS2007. Хотя в MOSS2007 есть сценарии, основанные на нескольких индексных блоках, они не являются избыточными, как вы думаете. Скорее всего, у вас будет одно поле индекса и несколько блоков запросов (или веб-серверы, которые также являются серверами запросов).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...