Использование Python для MapReduce для Cassandra Dumb? - PullRequest
4 голосов
/ 27 марта 2010

Поскольку в Cassandra еще нет встроенного MapReduce (я думаю, что он выйдет в версии 0.7), глупо ли пытаться использовать MapReduce с моим клиентом Python или мне просто нужно использовать CouchDB или Mongo или что-то еще?

Приложение представляет собой сбор статистики, поэтому мне нужно иметь возможность суммировать значения с группированием по счетчикам приращений. Нет, но притворяюсь, что я делаю аналитику Google, поэтому я хочу отслеживать, какие браузеры появляются, на какие страницы они заходили, и посещения или просмотры страниц.

Я бы просто обновил свои счетчики при записи, но Кассандра тоже не очень хороша в счетчиках.

Может Кассандра просто не правильный выбор для этого?

Спасибо!

Ответы [ 2 ]

6 голосов
/ 27 марта 2010

Cassandra поддерживает уменьшение карты, начиная с версии 0.6. (Текущий стабильный выпуск - 0.5.1, но попробуйте новую функциональность сокращения карт в 0.6.0-бета3). Для начала я рекомендую взглянуть на пример сокращения количества слов в «contrib / word_count».

3 голосов
/ 27 марта 2010

MongoDB имеет обновление на месте, поэтому MongoDB должен хорошо работать со счетчиками. http://blog.mongodb.org/post/171353301/using-mongodb-for-real-time-analytics

...