Лучшая практика управления подключением Impala - PullRequest
0 голосов
/ 23 мая 2018

Я хочу использовать Cloudera Impala в Clodera Hadoop 2.6.0-cdh5.10.0 для выполнения некоторых запросов в Java с наилучшей производительностью в условиях высокой нагрузки.

Я уже прочитал официальную документацию https://www.cloudera.com/documentation/enterprise/5-10-x/topics/impala_jdbc.html но есть несколько моментов, которые я не совсем понял.Я использую зависимость Hive для подключения к Impala

<dependency>
   <groupId>org.apache.hive</groupId>
   <artifactId>hive-jdbc</artifactId>
   <version>1.1.0-cdh5.10.0</version>
   <classifier>standalone</classifier>
</dependency>

Теперь, пожалуйста, скажите мне, как лучше всего создавать и распоряжаться подключениями Impala:

  • Должен ли я использовать DriverManager.getConnection внутри блока try-with-resource?Будет ли это вызывать создание нового физического соединения для каждого запроса?Другими словами, это тяжелая операция для создания соединения таким образом?
  • Есть ли пул соединений на стороне сервера?Должен ли я использовать DataSource.getConnection (как в JavaEE) или что-то еще, чтобы использовать этот пул соединений?
  • Или мне следует использовать некоторые библиотеки из 3-х частей, такие как org.apache.commons:commons-dbcp2, для создания пула соединений на стороне клиента?

Спасибо за ваше время

...