NoSQL идеально подходит для хранения статистики? - PullRequest
4 голосов
/ 24 марта 2010

Я не очень знаком с системами NoSQL, но помню, что читал некоторое время назад, что они идеально подходят для обработки статистических данных.

Поскольку я собираюсь начать писать код, который будет записывать такие данные, как «сколько пользователей было зарегистрировано в день», я подумал, что смогу использовать это как возможность узнать больше о NoSQL, если он отвечает всем требованиям.

Если NoSQL действительно идеально подходит для этого, не могли бы вы предоставить мне некоторую информацию о том, почему? И какие конкретные системы лучше всего подходят для этой конкретной потребности?

Итак, после первого ответа, может быть, полезно уточнить немного.

В настоящее время у меня есть база данных PostgreSQL, из которой я буду получать данные. Это будет очень просто, и не нужно никаких расчетов. Например, я просто получу набор результатов с количеством пользователей, зарегистрированных каждый день за последний месяц (так что в основном это будет просто набор пар значений для даты / пользователей), и сохраню их в другой таблице / базе данных.

Спасибо!

Ответы [ 2 ]

5 голосов
/ 24 марта 2010

Это отчасти зависит от того, какого рода анализ вы собираетесь проводить по этой статистике. Если вы собираетесь выполнять множество различных операций (усреднение, суммирование, объединение ...), вы можете найти решения NoSQL более трудными, чем они того стоят.

Однако, если вы храните статистику в основном для отображения или для очень специфических процедур анализа, решения NoSQL начинают сиять.

Если ваши данные достаточно малы, используйте решение SQL, которое даст преимущество полного механизма запросов для работы, но если у вас много значений (одно значение в день - ничто, даже если вы работали в течение миллиона лет, и обеспокоены размером и производительностью хранилища, варианты NoSQL снова могут стоить этого.

Если ваши данные частично структурированы, взгляните на CouchDB, который предлагает некоторую элементарную поддержку индексации и запросов, что может послужить некоторой основой для процедур анализа. Если вы храните отдельные значения с очень небольшой структурой, мой лучший совет - взглянуть на Tokyo Cabinet и Tokyo Tyrant, которые являются абсолютно невероятными вариантами хранения ключей-значений.

0 голосов
/ 24 марта 2010

Системы NoSQL имеют тенденцию оптимизировать случай, когда данные хранятся часто, но к ним обращаются редко. В случае статистики вы можете собирать много данных с (социального) сайта часто небольшими порциями, что оптимизировано для. Но поиск и анализ могут быть медленнее ... Конечно, это зависит от того, какую систему "NoSql" вы решите использовать.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...