MapReduce - модель обработки;он точно говорит вам, во что должна вписаться ваша задача обработки.
- Ваша обработка должна быть ориентирована на пакет
- Вы должны быть в состоянии преобразовать свою работу в (набор) карту и сократить количество шагов.
- Для того, чтобы иметьЛюбое преимущество свойств масштабируемости MapReduce позволяет разделить работу на достаточно независимые (!!) фрагменты, которые можно обрабатывать отдельно.
Hadoop делает (среди прочего) MapReduce с добавленнымПреимущество заключается в том, что вы действительно можете выполнять работу надежно на 1000 параллельных системах (если у вас достаточно независимых компонентов).
С учетом этих ограничений: некоторые вещи не могут быть выполнены, а многие могут быть выполнены.Анализ файлов журналов (т. Е. Большого набора независимых строк) или даже веб-аналитики (каждый отдельный посетитель / сеанс может обрабатываться отдельно) являются одними из самых распространенных приложений.
Так что да, ваша задача должна быть преобразована в соответствиив модели для работы.