Первый раз MapReduce: мне нужно объединить и считать, пожалуйста, помогите - PullRequest
0 голосов
/ 30 мая 2011

У меня есть коллекция, и мне нужно получить различное количество из набора данных в MongoDB

db['2011-05-29'].distinct("plugins.HTTPServer.string");

возвращает все отдельные имена для ключа

Как мне получить счетчик для каждого вхождения конкретной строки?

Пример:

Apache 29172
IIS 3932

Я посмотрел несколько примеров MapReduce, но не могу заставить его работать правильно. По моим подсчетам в сумме получается больше, чем фактических предметов в коллекции.

db['2011-04-13-1pm-scan'].distinct("plugins.HTTPServer.string").length; 

возвращает количество различных элементов в этом ключе.

Однако я хочу, чтобы значение ключа и количество для каждого, как указано выше.

1 Ответ

1 голос
/ 30 мая 2011

Ваш вопрос на 100% точно, что делает демонстрационное приложение wordcount. Он является частью стандартного набора примеров, поставляемых с Hadoop, и подробно описан здесь на этих страницах

  1. http://wiki.apache.org/hadoop/WordCount
  2. http://developer.yahoo.com/hadoop/tutorial/module4.html#wordcount

НТН

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...