Python Connect для Hive на EMR - PullRequest
0 голосов
/ 10 мая 2018

Есть ли способ подключения к таблице Hive в кластере AWS EMR через Python?

Я пробовал несколько пакетов, таких как pyhive, ibis и impyla, чтобы назвать несколько, но не повезло. Я пытался использовать точную информацию как то, что я использую в PuTTy для ssh, но все равно продолжаю получать ошибки.

В PuTTy:

Имя хоста: (имя пользователя) @ (Основной публичный DNS EMR)

Порт: 22 * ​​1009 *

Auth: с помощью файла .ppk

Информация EMR

from pyhive import hive
conn = hive.Connection(host = "(Master public DNS of EMR)",
                       port = 22, username = '(username)', database = '(database)')

Это ошибка, которую я получаю:

TTransportException: Could not start SASL: b'Error in sasl_client_start (-4) SASL(-4): no mechanism available: Unable to find a callback: 2'

Должен ли я также использовать файл .ppk?

...