Извлечь в MongoDB для анализа - PullRequest
0 голосов
/ 01 июня 2011

У меня есть реляционная база данных с примерно 300 миллионами клиентов и их атрибутами с нескольких точек зрения (360).Для выполнения некоторой аналитики я намереваюсь сделать отрывок к MongoDB, чтобы иметь «плоское» представление, которое больше подходит для применения методов интеллектуального анализа данных.Будет ли это иметь смысл?Почему?

Спасибо!

Ответы [ 3 ]

0 голосов
/ 01 июня 2011

Это может иметь смысл. Одна вещь, которую вы можете сделать, это настроить MongoDB в горизонтальном горизонтальном масштабировании. Затем с правильными структурами данных вы можете параллельно выполнять запросы через шарды (что он может сделать для вас автоматически):

http://www.mongodb.org/display/DOCS/Sharding

Это могло бы сделать возможным анализ в реальном времени, если бы это было иначе.

Если вы правильно выберете свои модели данных, вы можете ускорить свои запросы, избегая любых видов объединений (опять же, хорошо по горизонтали).

Наконец, вы можете многое сделать с картой / уменьшить ваши данные.

http://www.mongodb.org/display/DOCS/MapReduce

Следует помнить, что нет ничего лучше, чем службы отчетов SQL для MongoDB AFAIK.

0 голосов
/ 01 июня 2011

Я считаю, что редукция карты MongoDB медленная (однако они работают над ее улучшением, см. Здесь: http://www.dbms2.com/2011/04/04/the-mongodb-story/).

Может быть, вы можете использовать общественную версию Infobright для аналитики?Смотрите здесь: http://www.infobright.com/Community/

Реляционные БД, такие как Postgresql, тоже могут выполнять аналитику (afaik MySQL не может выполнять хеш-соединение, но другие реляционные БД могут).

0 голосов
/ 01 июня 2011

Нет.

Здесь не проблема хранения, это ваша стратегия выравнивания.

Как и где вы храните сведенные данные, это второстепенная проблема, обратите внимание, MongoDB - это база данных документов, которая в любом случае не является плоской.

Как только вы получите данные в форме, подходящей для вашегоЗатем посмотрите на стратегии хранения, MongoDB может подойти, или вы обнаружите, что что-то, что позволяет легко использовать функциональность типа Map Reduce, будет лучше для анализа ... (HBase, например)

...