Я рассматриваю Подтверждение концепции для обработки больших объемов данных, таких как> 10 ГБ, для которых требуется как минимум 200+ операций записи в секунду и более 50+ операций чтения в секунду для пространственных данных.Это тоже растущая система.В настоящее время я рассматриваю возможность перемещения этих больших объемов данных в виде больших таблиц NoSql в виде db по соображениям производительности.
Я рассмотрел и более подробно рассмотрел MongoDB и cassandra.Что касается моего чтения,
Mongodb: - кажется, есть проблема с блокировкой записи - одна из публикаций в stackoverflow предложила эту базу данных, если нет необходимости в нескольких серверах - индексы хранятся в памяти.Таким образом, чем больше рост индекса, тем хуже производительность - преимущество в том, что Mongodb имеет прямую поддержку пространственных данных и индексации, а также такие функции, как поиск близлежащих мест и т. Д., - я вижу этот пост Cassandra или MongoDB для нашего местоположения на основеПриложение , предлагающее mongodb в качестве наилучшего выбора
Кассандра:
- Кажется, является лучшим среди связанных БД - Кажется, что имеет отличную производительность записи и чтения - Не поддерживает изначально пространственную индексациюно это может быть расширено с помощью геохэшинга
Мое сердце на самом деле обращается к mongodb из-за его хорошей документации и прямой поддержки пространственных данных.У кого-нибудь был плохой опыт использования mongodb для таких больших систем?На самом деле я вижу много сообщений на iostat mongodb для производительности.
Если mongodb не подходит, кто-то может дать некоторые советы по геохешированию с использованием cassandra?Я видел ссылку http://code.google.com/p/geospatialweb/ для создания хэшей.Но есть вопросы о том, как запросить и т.д.?