Обновление (август 2014 г.): Стратосфера теперь называется Апач Флинк (инкубация).
Взгляните на Стратосфера .Это еще одна среда выполнения больших данных, которая предлагает больше операторов (отображение, уменьшение, объединение, объединение, пересечение, итерация, ...).Он также позволяет определять расширенные графы потоков данных (с помощью Hadoop MR вам придется объединять задания).
Стратосфера также поддерживает BSP с его абстракцией обработки графа (называемой Spargel ).
Если вы любите читать научные статьи, взгляните на Nephele / PACTs: модель программирования и среда выполнения для аналитической обработки в масштабах сети , это объясняет теоретические основы системы.
Другая система в этой области - Spark , которая имеет собственную модель (СДР).Так как BSP был упомянут здесь, также посмотрите на GraphLab , предложение альтернативы BSP.