Я пытаюсь написать AWS Клей в оболочке python для преобразования всех файлов .xls из корзины s3 в формат .csv. Я начал с использования простого тестового сценария для преобразования одного файла xls в файл csv, например:
import pandas
read_file = pd.read_excel ('s3://s3foler/../../name_of_file.xls')
read_file.to_csv ('s3://s3folder/../../name_of_file.csv', index = None, header=True)
У меня также есть файл колеса xlrd в конфигурации.
При выполнении этого задания происходит сбой со следующей ошибкой:
Traceback (most recent call last):
File "/tmp/runscript.py", line 117, in <module>
download_and_install(args.extra_py_files)
File "/tmp/runscript.py", line 63, in download_and_install
subprocess.check_call([sys.executable, "-m", "pip", "install", "--target=
{}
".format(install_path), local_file_path])
File "/usr/local/lib/python3.6/subprocess.py", line 311, in check_call
raise CalledProcessError(retcode, cmd)
subprocess.CalledProcessError: Command '['/usr/local/bin/python', '-m', 'pip', 'install', '--target=/glue/lib/installation', '/tmp/glue-python-libs-1qiis6yj/xlrd-1.2.0-py2.py3-none-any.whl']' returned non-zero exit status 2.
Что может быть причиной этой ошибки? Это первая в истории работа с клеем, написанная мной. Буду признателен за любую помощь.
У меня может быть неправильный файл колеса - есть ли какие-нибудь предложения о том, откуда скачать правильный файл колеса xlrd? Я скачал его с здесь
Примечание: я использую aws -data-wrangler , чтобы иметь возможность импортировать pandas.