Глобальный доступный кэш Spark Thrift Server с одним контекстом - PullRequest
0 голосов
/ 04 июня 2019

Я прочитал эту статью http://www.russellspitzer.com/2017/05/19/Spark-Sql-Thriftserver/ и запутался.В нем говорится:

Контексты Spark также не могут совместно использовать кэшированные ресурсы между собой.Это означает, что если у вас нет единого контекста Spark, несколько пользователей не смогут совместно использовать кэшированные данные.Сервер Spark Thrift может быть тем «единым контекстом», обеспечивающим глобально доступный кэш.

Контекст Spark для экономичного сервера в состояниях SO:

Контекст Spark в Thrift-сервере только один.Сервер Spark Thrift не подходит для высокопараллельного доступа к приложениям.

Таблицы и др. Используют соединение SIMBA с Spark SQL, но, исходя из приведенных выше противоречивых утверждений, какой вывод следует сделать?

Более того, пользователи, использующие разрозненные операторы SQL, не получат выгоду от кэширования, поскольку у них есть все свои собственные SQL.Я думаю, что кеширование может сработать, если применяется предварительное кеширование с билайна на базовые таблицы.Или это не правда?

...