Легко начать.
Вот часто задаваемые вопросы: http://aws.amazon.com/elasticmapreduce/faqs/
А вот руководство по началу работы: http://docs.amazonwebservices.com/ElasticMapReduce/latest/GettingStartedGuide/
Если у вас уже есть учетная запись EC2, вы можете включить MapReduce и запустить пример приложения менее чем за 10 минут, используя Консоль управления AWS.
Я сделал предварительно упакованное приложение-пример Word Count, которое возвращает количество каждого слова, содержащегося в примерно 20 МБ текста. Вы можете подготовить до 20 экземпляров для одновременной работы, хотя я только использовал 2 экземпляра, и задание было выполнено примерно за 3 минуты.
Задание возвращает алфавитный список слов объемом 300 КБ и частоту появления каждого слова в корпусе образца.
Мне действительно нравится, что задания MapReduce могут быть написаны на моем выборе Perl, Python, Ruby, PHP, C ++, R или Java. Процесс был безболезненным и простым, а интерфейс дает хорошие отзывы о состоянии ваших экземпляров и ходе работы.
Имейте в виду, что поскольку AWS взимает плату за полный час при создании экземпляра и поскольку экземпляры MapReduce автоматически завершаются в конце потока работ, стоимость нескольких быстро выполняющихся потоков заданий может быстро возрасти.
Например, если я создаю поток заданий, который использует 20 экземпляров и возвращает результаты через 15 минут, а затем повторно запускаю поток заданий еще 3 раза, мне придется платить за 80 часов машинного времени, хотя я только 20 экземпляров работали в течение 1 часа.