Мы разработали и открыли источник данных, который позволит пользователям работать со своими транзакционными таблицами Hive ACID с помощью Spark.
Github: https://github.com/qubole/spark-acid
Он доступен в виде пакета Spark, и инструкции по его использованию находятся на странице Github. В настоящее время источник данных поддерживает только чтение из таблиц Hive ACID, и мы работаем над добавлением возможности записи в эти таблицы также через Spark.
Отзывы и предложения приветствуются!