Question

У нас есть система, в которой мы хотели бы хранить около 100 миллионов документов. Нам нужно иметь возможность выполнять их итерацию и выполнять очень простые операции поиска, получать документ с использованием уникального идентификатора и использовать тривиальные запросы метаданных, такие как получение по дате публикации и источнику.

Мы будем часто обновлять базу данных новыми документами и удаляя старые, и мы хотели бы избежать больших работ по обслуживанию. Отлично, если его легко скопировать или отразить без особого запаха.

В настоящее время мы используем SQL-сервер для этого, но нам нужно нечто более легковесное.

Любые рекомендации?

Eugene · Answer 1 · 26 марта 2012

Какой-то NVP (NoSQL) будет лучшим. Учитывая ваши требования, я рекомендую mongodb. Он поддерживает все функции, которые вы ищете:

Предназначен для больших наборов документов. Поддерживает вторичные индексы для ваших запросов метаданных. Легко настроить наборы реплик. Предназначен для быстрой работы и высокого масштаба. С ним легко установить и начать работу, а с программистом работать с ним довольно просто.

Cassandra - еще одно возможное решение, но оно требует немного больше работы для настройки и планирования вашей схемы. Его главное преимущество - лучшая поддержка для шардинга нескольких центров обработки данных и избыточности. В отличие от монго, Кассандра не использует систему репликации мастер-раб.

Рекомендации по хранению баз данных / блобов на основе Windows

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Рекомендации по хранению баз данных / блобов на основе Windows

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов