Для * Apache Spark не требуется для его запуска на виртуальной машине.Вы можете прекрасно запустить его на своем компьютере локально.Однако обычно, когда вы работаете с программным обеспечением, таким как Apache Spark, вы обрабатываете огромные объемы данных, и при этом необходимо запускать большое количество экземпляров программного обеспечения в кластерах.Этот тип требований, который является следствием наличия больших наборов данных, означает, что имеет больше смысла запускать их на виртуальных машинах, которые могут иметь несколько на одном сервере вместо одного экземпляра на физический сервер.