Я думаю, что вы неправильно понимаете.
Они ссылаются на концепцию стороннего упаковщика данных.
"... Они позволяют запросам PostgreSQL включать структурированные или неструктурированные данные из нескольких источников, таких как базы данных Postgres и NoSQL, а также из HDFS, как если бы они были в одной базе данных. ...
«
Это звучит для меня как подход Oracle Big Data Appliance. В Postgres вы можете рассматривать мир обработки данных логически, как если бы это был весь Postgres, но под водой к данным HDFS обращаются с помощью механизма запросов Spark, вызываемого механизмом запросов Postgres, но вам не нужно беспокоиться о том, что это вероятная предпосылка , Мы находимся в области виртуализации. Вы можете объединять большие данные и данные Postgres на лету.
Не существует такой вещи, как данные Spark, поскольку она не является базой данных, за исключением некоторых данных, отформатированных Spark и не совместимых с Hive.
Значение будет неизменно указываться, что вам не нужно изучать большие данные и т. Д. Будь это истина, еще неизвестно.