Amazon Elastic MapReduce предназначен для интеграции с EC2 и S3, обеспечивая инфраструктуру для приложений интенсивной обработки данных.
MapReduce сосредоточен вокруг концепции потока работ, где каждое задание может содержать один или несколько шагов. Каждый шаг берет некоторые данные из S3, распределяет их по настроенным экземплярам EC2 и затем записывает результаты обратно в S3.
Таким образом, в основном вы должны загрузить свое приложение и данные на S3, затем настроить, сколько и какого типа экземпляров EC2 вы хотите, указать местоположение вашего приложения и данных на S3, а затем начать работу. Вы можете запустить задание несколькими способами: либо войти в Консоль управления AWS, либо использовать существующие API или инструменты командной строки.
Существует также библиотека C # для MapReduce, доступная на Amazon , которая может помочь.
Однако вы должны заметить, что ваше приложение должно использовать модель программирования MapReduce, чтобы иметь возможность работать распределенно, поэтому вы не можете просто запустить какой-либо код .Net.
Здесь есть еще один пост с некоторыми хорошими ответами , касающийся каркасов .Net в отношении реализации MapReduce.