Попытка запустить простую работу в AWS Glue выдает ошибку с файлом xlrd wheel - PullRequest
0 голосов
/ 29 апреля 2020

Я пытаюсь написать AWS Клей в оболочке python для преобразования всех файлов .xls из корзины s3 в формат .csv. Я начал с использования простого тестового сценария для преобразования одного файла xls в файл csv, например:

import pandas

read_file = pd.read_excel ('s3://s3foler/../../name_of_file.xls')
read_file.to_csv ('s3://s3folder/../../name_of_file.csv', index = None, header=True)

У меня также есть файл колеса xlrd в конфигурации.

При выполнении этого задания происходит сбой со следующей ошибкой:

Traceback (most recent call last):
  File "/tmp/runscript.py", line 117, in <module>
    download_and_install(args.extra_py_files)
  File "/tmp/runscript.py", line 63, in download_and_install
    subprocess.check_call([sys.executable, "-m", "pip", "install", "--target=
{}
".format(install_path), local_file_path])
  File "/usr/local/lib/python3.6/subprocess.py", line 311, in check_call
    raise CalledProcessError(retcode, cmd)
subprocess.CalledProcessError: Command '['/usr/local/bin/python', '-m', 'pip', 'install', '--target=/glue/lib/installation', '/tmp/glue-python-libs-1qiis6yj/xlrd-1.2.0-py2.py3-none-any.whl']' returned non-zero exit status 2.

Что может быть причиной этой ошибки? Это первая в истории работа с клеем, написанная мной. Буду признателен за любую помощь.

У меня может быть неправильный файл колеса - есть ли какие-нибудь предложения о том, откуда скачать правильный файл колеса xlrd? Я скачал его с здесь

Примечание: я использую aws -data-wrangler , чтобы иметь возможность импортировать pandas.

...