Pervasive DataRush - это среда для программирования параллельных потоков данных для любого языка JVM, включая Clojure.
Pervasive DataRush использует архитектуру потока данных.Архитектура реализует программу, которая выполняется в виде графа вычислительных узлов, связанных между собой очередями потока данных.Узлы используют очереди для обмена данными.Поскольку данные передаются в потоковом режиме, в любой момент времени в памяти должны находиться только данные, необходимые для любой активной операции, что позволяет анализировать очень большие наборы данных.Помимо возможности масштабирования для задач, превышающих доступную память, графики потоков данных используют несколько форм параллелизма.
Клиенты используют DataRush для анализа больших данных и подготовки данных (ETL).