Как загрузить драйвер RDBMS для H2O в ноутбуке Jupyter? - PullRequest
0 голосов
/ 21 февраля 2019

Я хотел бы создать автономную записную книжку Jupyter, которая использует h2o для импорта и моделирования данных, которые находятся в реляционной базе данных. Документы показывают пример, где h2o запускается с драйвером JDBC в пути к классам, например,

java -cp <path_to_h2o_jar>:<path_to_jdbc_driver_jar> water.H2OApp

Я бы предпочел запустить h2o с ноутбука, который представляет собой отдельный воспроизводимый артефакт, а нечем специальные шаги для подготовки среды перед запуском ноутбука.Если я запускаю следующий фрагмент:

import h2o
h2o.init()

connection_url = "jdbc:mysql://mysql.woolford.io/mydb"
select_query = "SELECT description, price FROM mytable"
username = "myuser"
password = "b@dp@ss"
mytable_data = h2o.import_sql_select(connection_url, select_query, username, password)

... метод import_sql_select завершается ошибкой, поскольку драйвер не загружен:

Server error java.lang.RuntimeException:
  Error: SQLException: No suitable driver found for jdbc:mysql://mysql.woolford.io/mydb

Есть ли способ загрузить драйверкогда h2o.init() звонок сделан?Или лучшая практика для этого?

1 Ответ

0 голосов
/ 21 февраля 2019

h2o.init() принимает параметр с именем extra_classpath.Вы можете использовать этот параметр, чтобы указать путь к драйверу JDBC, и H2O запустится вместе с драйвером.

Эта опция предназначена именно для того, чтобы не запускать H2O вне интерфейса ноутбука.

Пример:

import h2o
h2o.init(extra_classpath=["/Users/michal/Downloads/apache-hive-2.2.0-bin/jdbc/hive-jdbc-2.2.0-standalone.jar"])
...