В «Концепциях, теориях и приложениях больших данных» я обнаружил краткое описание MLST и DAG. Тем не менее, описание не дает ответа на вопрос ПОЧЕМУ одна распределенная система использует MLST, а другая - DAG? Что это означает с точки зрения производительности / задержек / многопользовательских / и т. Д.?
Я заметил, что DAG используется распределенными вычислительными механизмами (то есть Apache Spark, Storm, Tez), в то время как MLST используетсяинтерактивными распределенными базами данных (например, Google Dremel, Apache Impala, Presto). Это всегда так?