Сколько выигрыша в вычислительных ресурсах можно ожидать от GAE MapReduce?Интересующий меня сценарий требует значительных вычислительных ресурсов, например: умножение триллиона случайных чисел в одноядерном приложении.Затем представьте, что 1000 работников MapReduce умножают по миллиарду случайных чисел на каждого и объявляют «закончили», когда все работники закончили.Предположим, биллинг включен, если это имеет значение.(Возможно, нет).
Редактировать: комментатор попросил разъяснений. Название было изменено.Если задача занимает 50000 секунд в однопоточном режиме и в альтернативной реализации задействовано 1000 рабочих MapReduce, которые завершают работу через 500 секунд, то увеличение производительности в 100 раз.1000 рабочих: рост в 100 раз, только немного разочаровывает, но так и будет в этом примере. Как я могу закончить раньше?Могу ли я попросить 10000 работников?Этот вопрос может иметь отношение к ограничениям и квотам.Примите адекватный бюджет.Ускоряет ли MapReduce интенсивную обработку вычислений асимптоту, и если да, то каково увеличение производительности этой асимптоты? В комментарии также содержалась информация о том, что MapReduce подходит для больших объемов данных, сгенерированных URL, обращенным к пользователю, однако,Мой вопрос не касается производительности приложения, интенсивно использующего хранилище данных, по сравнению с тем же приложением, переписанным для MapReduce.В этом ресурсоемком сценарии активность хранилища данных будет минимальной.Я понимаю, что в любом приложении MapReduce всегда будет какое-то действие с хранилищем данных, но, поскольку это сценарий с интенсивными вычислениями, действие хранилища данных и размер сущностей хранилища данных не окажут большого влияния на вычисляемый прирост производительности.Задача будет использовать хранилище данных менее 1% прошедшего времени.Сценарий также не предусматривает большой пропускной способности связи (кроме минимума, необходимого для попадания в URL-адреса в очереди задач, которые использует MapReduce).Вопрос заключается в том, чтобы сравнивать затраченное время однопоточной задачи, не связанной с MapReduce, с интенсивными вычислениями, с затраченным временем той же задачи в MapReduce, которое по своей сути является многопоточным, учитывая наличие нескольких рабочих.Я использую слово «задача» в общем, другими словами, «задача означает работу».Прибыль может (но не обязательно) зависеть от количества работников, поэтому в примере я упомянул 1000 работников.