Запрос улья из колбы - PullRequest
       41

Запрос улья из колбы

0 голосов
/ 16 октября 2018

Я новичок в фляге, и я использую следующую флягу печенья , чтобы начать с быстрого прототипа.Основная идея проекта - собрать данные из кластера улья и передать их конечному пользователю с помощью колбы.

Хотя я успешно смог подключить флягу к серверу улья с помощью соединителя pyhive, но у меня возникает странная проблема, связанная с select limit, когда я пытаюсь запросить более 50 элементов.

В моем случае я создал только класс Hive, похожий на разработку расширения колбы, для pyhive аналогичной демонстрации:

from pyhive import hive
from flask import current_app

# Find the stack on which we want to store the database connection.
# Starting with Flask 0.9, the _app_ctx_stack is the correct one,
# before that we need to use the _request_ctx_stack.
try:
    from flask import _app_ctx_stack as stack
except ImportError:
    from flask import _request_ctx_stack as stack


class Hive(object):

    def __init__(self, app=None):
        self.app = app
        if app is not None:
            self.init_app(app)

    def init_app(self, app):
        # Use the newstyle teardown_appcontext if it's available,
        # otherwise fall back to the request context
        if hasattr(app, 'teardown_appcontext'):
            app.teardown_appcontext(self.teardown)
        else:
            app.teardown_request(self.teardown)

    def connect(self):
        return hive.connect(current_app.config['HIVE_DATABASE_URI'], database="orc")

    def teardown(self, exception):
        ctx = stack.top
        if hasattr(ctx, 'hive_db'):
            ctx.hive_db.close()
        return None

    @property
    def connection(self):
        ctx = stack.top
        if ctx is not None:
            if not hasattr(ctx, 'hive_db'):
                ctx.hive_db = self.connect()
            return ctx.hive_db

и создал конечную точку для загрузки данных из улья:

@blueprint.route('/hive/<limit>')
def connect_to_hive(limit):
    cur = hive.connection.cursor()
    query = "select * from part_raw where year=2018 LIMIT {0}".format(limit)
    cur.execute(query)
    res = cur.fetchall()
    return jsonify(data=res)

При первом запуске все работает нормально, если я пытаюсь загрузить вещи, содержащие не более 50 элементов, но, как только я увеличиваю их, он остается в состоянии, в котором ничего не загружается.Однако, когда я загружаю данные с помощью ноутбуков Jupyter, все работает нормально, поэтому я подозреваю, что я мог что-то пропустить в своем коде фляги.

1 Ответ

0 голосов
/ 17 октября 2018

Проблема заключалась в проблемах с версией библиотеки, решив эту проблему, добавив к моим требованиям следующее:

# Hive with needed dependencies
sasl==0.2.1
thrift==0.11.0
thrift-sasl==0.3.0
PyHive==0.6.1

Старая версия была следующей:

sasl>=0.2.1
thrift>=0.10.0
#thrift_sasl>=0.1.0
git+https://github.com/cloudera/thrift_sasl  # Using master branch in order to get Python 3 SASL patches
PyHive==0.6.1

Как указано в разработкефайлы требований в проекте Pyhive.

...