Ошибка импорта для пакета обучения scikit в Redshift UDF - PullRequest
1 голос
/ 27 июня 2019

Я пытаюсь импортировать библиотеку scikit-learn в Redshift, но получаю ошибку: 'Не каталог', '/rdsdbdata/user_lib/1/0/627380.zip/sklearn/__check_build')

Я следовал ниже шагов:

  1. Загруженный релиз scikit-learn версии 0.18.1 / 0.18.2, так как для этого выпуска требуется: Python (> = 2.6 или> = 3.3), NumPy (> = 1.6.1), SciPy (> = 0.9) и красное смещение имеют Python 2.7, numpy 1.8.2, scipy 0.12.1.

  2. Загружен zle-файл sklearn в s3

  3. Создана библиотека в Redshift:

CREATE or replace LIBRARY sklearn 
LANGUAGE plpythonu FROM 's3://<path>/sklearn.zip' CREDENTIALS 'aws_access_key_id=<access_key>;aws_secret_access_key=<secret_key>';
  1. Созданная функция:
create or replace function f_py_scikit ()
  returns varchar
stable
as $$
  import sklearn
  return 'sklearn: {}'.format(sklearn.__version__)
$$ language plpythonu;
select f_scikit();

[Amazon](500310) Invalid operation: OSError: (20, 'Not a directory', '/rdsdbdata/user_lib/0/0/627380.zip/sklearn/__check_build'). Please look at svl_udf_log for more information

svl_udf_log:

   query    message created traceback   funcname    node    slice   seq
0   OSError: (20, 'Not a directory', '/rdsdbdata/user_lib/0/0/627380.zip/sklearn/__check_build') 1000   20000   0
...