Нет ограничений, которые не позволяют программам MPI использовать локальные диски.И, конечно, MPI-программы всегда пытаются работать локально с данными - в ОЗУ или на локальном диске - как и все параллельные приложения.В MPI 2.0 (который не является будущей версией, он здесь уже десять лет) можно динамически добавлять и удалять процессы, что позволяет реализовывать приложения, которые могут восстанавливаться после, например, процесса, умирающего на каком-либо узле.
Возможно, hadoop не использует MPI, потому что MPI обычно требует кодирования на C или Fortran и имеет более научную / академическую культуру разработчиков, в то время как hadoop, похоже, больше ориентируется на ИТ-специалистов с сильным уклоном Java.MPI очень низкоуровневый и подвержен ошибкам.Это позволяет очень эффективно использовать оборудование, оперативную память и сеть.Hadoop старается быть высокоуровневым и надежным, со снижением эффективности.Программирование MPI требует дисциплины и большой осторожности, чтобы быть переносимым, и все же требует компиляции из исходного кода на каждой платформе.Hadoop очень портативен, прост в установке и позволяет довольно быстро и грязно разрабатывать приложения.Это другая сфера применения.
Тем не менее, возможно, за шумихой из-за hadoop последуют более ресурсоэффективные альтернативы, возможно, основанные на MPI.